下一代副本删除技术的优势

2019-11-04 01:17:48

字体：大中小

来源：转载

供稿：网友

DeltaStor软件使企业存储治理人员用和物理磁带相当的成本，享有磁盘存储的高速、灵活以及高效成为可能。另外，通过以比磁带更少的物理磁盘空间存储更多的数据，DeltaStor软件显著减少了电力、制冷、安全以及其他操作和基础架构的成本。

即时数据恢复。数据在线存储，可以实现即时的随机访问。
更快速的备份。DeltaStor软件在主要数据传输路径之外执行副本删除（de-duplication），使得S2100-ES2能以2400MB/s的速度执行备份，高于磁带30多倍。
高可扩展性，足以应对指数级的数据增长。S2100-ES2具有强大的网格架构，支持构建任意规模的备份设备。另外，S2100-ES2答应对容量和性能进行简便的、无缝的升级，用户可以按需定购。单台设备容量可以以10TB的增量从10TB扩展到超过25PB。
减少耗时的磁带治理工作。在磁盘上保留更多的数据减少了处理磁带、查找磁带故障和治理容量供给的劳动量。
消除数据的物理威胁。和物理磁带可能会被丢失、盗窃或者损坏不同，磁盘上的数据保存在一个安全、高可用的环境中。
简化数据治理。添加DeltaStor软件只需要简单的在S2100-ES2治理控制台中选中复选框。当副本删除减少数据卷时，通过内建功能自动回收容量并实现治理。
将更多数据保留在磁盘上以满足兼容性和恢复时间要求。例如，在25TB的系统上，天天备份2.5TB的数据最多只能保存10天。而使用DeltaStor软件的S2100-ES2可以在相同的空间内保存相同的数据250天，同时提供基于磁盘数据保护的高性能以及其他优点。

基本技术原理SEPATON内容已知架构是经过全新设计的综合数据保护平台。SEPATON S2100-ES2虚拟磁带库核心应用包含了强大的软件，比如动态磁盘文件系统（DFS）和SEPATON I/O子系统（SIS），可以和DeltaStor软件协同工作，建立基于网格的智能数据保护平台。DeltaStor软件的核心是SEPATON内容已知的数据库。在备份会话中，当数据保存到磁盘阵列上的虚拟磁带时，软件模块调用“数据读取器”读取数据并同时分析出元数据存入该数据库中。“数据读取器”捕捉和每个独立的备份数据组相关的元数据，同时也捕捉每个数据组中每个对象的元数据。DeltaStor软件使用这些元数据标志数据对象之间的关系，并智能的做出处理决定。例如，当对象描述元数据指示出备份会话之间存在联系时，DeltaStor软件会显著地缩小数据分析范围，因此提高了副本删除的速度。该数据库保存在SEPATON动态文件系统的存储阵列中，具有全冗余的配置。因此，当数据增长时，该数据库可以自动调整以适应元数据的增长。为了和SEPATON的高可用设计模型保持一致，该软件可以通过简单地扫描S2100-ES2的虚拟磁带实现完全的元数据库重建。简要过程描述每次当备份任务完成时（例如：当卸载新产生的虚拟磁带时），S2100-ES2中的软件都发送一条消息，触发SEPATON内建的网格计算引擎启动DeltaStor副本删除过程，该过程分为5个阶段。网格引擎软件以负载均衡的方式调用系统内所有的计算资源进行任务调度和执行。这种能力实际上使该方案具有无限的可扩展性，因为任务可以被分配到所有可用的计算资源上。另外，用户可以有选择的添加DeltaStor节点，以提供额外的计算能力加速副本删除过程。副本删除的5个阶段如下：

数据收集
数据识别和/或数据比较
数据重组
完整性检查
空间回收

DeltaStor副本删除五阶段1．数据收集在数据收集阶段，软件通过比较进入的备份数据和先前的备份缩小需要进行分析数据的范围，使用“内容已知”数据库辨别它们之间可能的重复和相似数据。例如，假如名为同一个客户端中的“/root/documents/abc.txt”文件在备份中存在两次，DeltaStor软件自动决定采取何种动作。假如进入的数据是已存在数据的修改版本，该数据就进入下一阶段（数据识别、数据比较）的处理流程以确定数据发生的具体变化；假如进入的数据和已存在数据完全相同，那么进入下一阶段对数据副本进行校验。另外的数据收集操作包括：标志保存在不同位置(例如，不同的客户端，目录等等)的相同对象副本。软件为数据收集阶段发现的冗余数据对创建一工作列表，该表格用于数据识别和比较阶段进行进一步分析。2．数据识别/数据比较在数据识别/数据比较阶段，软件以字节为单位分析数据收集阶段标志出的相似数据对象。假如数据收集阶段创建的工作表表明需要进行数据识别，那么软件就会用delta差分算法确定备份组中的那些数据是唯一的、那些数据是重复的。该算法可以有效的以字节为单位映射发生变化的数据，并且对数据对象内的便宜或者位置改变不敏感，所以，即使相关的对象之间发生明显的结构改变，该算法仍可以定位冗余的数据。假如数据收集阶段从元数据级别认定备份组中的数据和前一个备份相同，那么在数据识别阶段将以字节为单位对数据进行比较。在该步骤中，软件调用数据比较器识别出数据发生变化的文件，即使其元数据仍然相同。3．数据重组数据识别、数据比较的结果被传递给数据重组过程，在该过程中数据被重新组装，放入临时的“保留磁带”中，新数据被保存，前一阶段被标出的重复数据被已存数据的指针替代。对备份软件而言，保留磁带和真正的磁带完全相同，只是存储在新磁带中的数据要远少于真正的磁带上存储的数据。从备份软件看来，数据是连续的并且也没有删除副本，SEPATON软件可以根据嵌入在文件系统中的指针读取重复数据的唯一一份副本。该过程的最终结果是产生一份经过副本删除的备份组视图。
4．可选的完整性检查在实际删除所有的重复数据前，软件执行一次可选的检查，以保证数据100%的完整。在本阶段中，软件通过将“保留磁带”（代表经过DeltaStor副本删除的数据）和原始数据进行比较验证其结构和整个的数据内容。5．空间回收在空间回收阶段，软件从文件系统中删除冗余的数据，释放先前被占用的磁盘空间以备他用。保留磁带和原始的、没有经过副本删除的磁带交换位置（比如条码、槽位以及属性等），然后软件智能的释放重复的区块并将它们放回空闲空间池。经过这样的处理以后，所有其他需要存储空间的数据处理过程都可以重用先前被重复数据占用的空间。产品中的DeltaStor软件操作DeltaStor软件要求的人工干预极少，它和S2100-ES2中的软件协同工作，能够处理所有的负载均衡、优化并自动执行任务。基于以下考虑，适当的配置是必要的：

每次备份增加到VTL的最大数据量。DeltaStor软件要求有足够存储两倍于一次备份增加数据量的磁盘空间。做为一种delta差分技术，该软件要求同时操作一个“基线”数据对象和一个修订对象。
备份窗口长度。和其他增值特性相比，DeltaStor软件总是优先保证主要的备份/恢复性能，只在系统资源空闲时才运行。假如由于备份和恢复窗口的原因没有足够的时间运行副本删除过程，SEPATON可以向网格引擎中增加专门的DeltaStor节点以满足要求。
希望的数据保存时间。当越来越多版本的相同数据保存在线时，副本删除的比例会变得越来越大。在实际环境中，经过副本删除的数据要求的磁盘空间量由原始数据大小、存储的版本数目和副本删除比例共同决定。
数据性质。假如大多数增加到VTL的数据都是新产生的数据（新数据库纪录或者新收集的地震数据等等），那么就没有多少重复数据可以让DeltaStor删除。相反，假如大多数数据是静态的（例如，Microsoft Exchange或者MS Office文档），那么该技术就会带来明显的好处。
数据类型。备份到VTL上的数据库和非数据库数据对象的比例不同，所要求的计算机处理特定数据环境的能力也不同。