老王技能厂|爱数如何驾驭数据洪流？，破局非结构数据备份与恢复难题( 二 ) 数据是21世纪的石油

其次是恢复快，针对原机，爱数提供完整恢复、挂载恢复和细粒度恢复， CDM保存原生数据格式，可以实现分钟级的数据挂载并快速恢复，同时细粒度精准恢复可以单独恢复某个选定的文件，从而避免了因恢复单个文件，而需要完全恢复的尴尬场景。
最后， AnyBackupFamily7支持多种恢复方式，这和恢复快密不可分。为满足客户高阶需求，如查询分析和容灾站点，爱数提供了挂载恢复和自动恢复。自动恢复可以实现把生产端的变更自动更新到目标端，为开发测试和容灾站点提供了极大便利。
言而总之，多种技术的聚合，实现了AnyBackupFamily7独有的超可用技术，突破了文件读写的I/O性能瓶颈，从而实现了海量非结构数据的超可用。

文章图片
以1小时备份1000万个小文件任务为例，采用传统方案，平均大小100KB的文件， 1小时只能备份36万个，平均大小为1MB的文件， 1PB的数据恢复完成需要约155天，而采用AnyBackupFamily7超可用方案，前者1小时可备份1000万文件，后者更是实现了分钟级可用。采用AnyBackupFamily7海量非结构化数据超可用方案，效率是传统方案的一万倍以上！
此外，爱数也实现了AnyShare场景下的高性能备份恢复，以及NAS场景下的海量非结构化数据超可用。

文章图片
AnyShare是基于对象存储的海量非结构数据管理平台，在6.0版本之前，除了备份性能慢和恢复性能满之外，数据管理平台还存在应用一致性的问题，在AnyShareFamily7版本，这些问题都得到了很好的解决。
其中包含两个关键技术，其一是OSS网关对象聚合技术，在生产过程中OSS网关直接将B级、KB级小文件聚合成MB级的大对象，确保对象存储里存的都是MB级大对象；其二是AnyBackup的编排调度服务，可以有效的去编排AnyShare三个组件之间备份的先后顺序，从而确保整个应用系统在备份恢复的时候，应用数据保证一致。
在NAS场景下，往往采用传统NDMP方式备份恢复，备份和恢复时间以天为单位，与此同时，数据以备份集存储在备份介质中，无法快速响应企业的数据查询等需求。

文章图片
爱数同样以多线程备份、多客户端并发和永久增量备份的方式，解决了备份性能问题。多线程备份， 100KB以上的小文件备份性能至少100MB/s以上；多客户端并发， 100KB以上的小文件备份性能至少270MB/s以上；永久增量备份，一次完备+N次增备。

文章图片
通过挂载恢复和细粒度恢复，爱数实现了高效恢复。灾难发生时，挂载恢复通过NFS挂载恢复实现分钟级灾难恢复；海量数据中需要恢复部分损坏的数据，细粒度恢复无需将整个灾备集恢复，只要通过NFS挂载恢复挂载到客户端，直接进行文件查找恢复；当面对数据查询需求时，原生格式的备份副本数据通过NFS挂载至查询服务器，爱数可快速提供数据查询服务。
爱数自我进化，为了无法计算的数据价值
2020年4月，数据作为一种新型生产要素，首次被正式写入国务院文件中，与土地、劳动力、资本、技术等传统要素并列为要素之一。与此同时，新基建横空出世，数据是新基建的基础，更是重要的生产资料，数据备份与恢复是新基建不可缺失的重要组成部分。
数据作为生产要素登堂入室，爱数则先一步洞察风向，完成自我进化。
2006年成立的爱数， AnyBackup历经两次升级， 2011年从备份市场进入灾备市场， 2016年进入灾备数据服务市场，多年占据国产市场第一， 2019年，爱数进一步完成了大数据基础设施战略的升级， AnyBackup成为这一战略的基底。