老王技能厂|爱数如何驾驭数据洪流?,破局非结构数据备份与恢复难题( 二 )


其次是恢复快 , 针对原机 , 爱数提供完整恢复、挂载恢复和细粒度恢复 , CDM保存原生数据格式 , 可以实现分钟级的数据挂载并快速恢复 , 同时细粒度精准恢复可以单独恢复某个选定的文件 , 从而避免了因恢复单个文件 , 而需要完全恢复的尴尬场景 。
最后 , AnyBackupFamily7支持多种恢复方式 , 这和恢复快密不可分 。 为满足客户高阶需求 , 如查询分析和容灾站点 , 爱数提供了挂载恢复和自动恢复 。 自动恢复可以实现把生产端的变更自动更新到目标端 , 为开发测试和容灾站点提供了极大便利 。
言而总之 , 多种技术的聚合 , 实现了AnyBackupFamily7独有的超可用技术 , 突破了文件读写的I/O性能瓶颈 , 从而实现了海量非结构数据的超可用 。
老王技能厂|爱数如何驾驭数据洪流?,破局非结构数据备份与恢复难题
文章图片
以1小时备份1000万个小文件任务为例 , 采用传统方案 , 平均大小100KB的文件 , 1小时只能备份36万个 , 平均大小为1MB的文件 , 1PB的数据恢复完成需要约155天 , 而采用AnyBackupFamily7超可用方案 , 前者1小时可备份1000万文件 , 后者更是实现了分钟级可用 。 采用AnyBackupFamily7海量非结构化数据超可用方案 , 效率是传统方案的一万倍以上!
此外 , 爱数也实现了AnyShare场景下的高性能备份恢复 , 以及NAS场景下的海量非结构化数据超可用 。
老王技能厂|爱数如何驾驭数据洪流?,破局非结构数据备份与恢复难题
文章图片
AnyShare是基于对象存储的海量非结构数据管理平台 , 在6.0版本之前 , 除了备份性能慢和恢复性能满之外 , 数据管理平台还存在应用一致性的问题 , 在AnyShareFamily7版本 , 这些问题都得到了很好的解决 。
其中包含两个关键技术 , 其一是OSS网关对象聚合技术 , 在生产过程中OSS网关直接将B级、KB级小文件聚合成MB级的大对象 , 确保对象存储里存的都是MB级大对象;其二是AnyBackup的编排调度服务 , 可以有效的去编排AnyShare三个组件之间备份的先后顺序 , 从而确保整个应用系统在备份恢复的时候 , 应用数据保证一致 。
在NAS场景下 , 往往采用传统NDMP方式备份恢复 , 备份和恢复时间以天为单位 , 与此同时 , 数据以备份集存储在备份介质中 , 无法快速响应企业的数据查询等需求 。
老王技能厂|爱数如何驾驭数据洪流?,破局非结构数据备份与恢复难题
文章图片
爱数同样以多线程备份、多客户端并发和永久增量备份的方式 , 解决了备份性能问题 。 多线程备份 , 100KB以上的小文件备份性能至少100MB/s以上;多客户端并发 , 100KB以上的小文件备份性能至少270MB/s以上;永久增量备份 , 一次完备+N次增备 。
老王技能厂|爱数如何驾驭数据洪流?,破局非结构数据备份与恢复难题
文章图片
通过挂载恢复和细粒度恢复 , 爱数实现了高效恢复 。 灾难发生时 , 挂载恢复通过NFS挂载恢复实现分钟级灾难恢复;海量数据中需要恢复部分损坏的数据 , 细粒度恢复无需将整个灾备集恢复 , 只要通过NFS挂载恢复挂载到客户端 , 直接进行文件查找恢复;当面对数据查询需求时 , 原生格式的备份副本数据通过NFS挂载至查询服务器 , 爱数可快速提供数据查询服务 。
爱数自我进化 , 为了无法计算的数据价值
2020年4月 , 数据作为一种新型生产要素 , 首次被正式写入国务院文件中 , 与土地、劳动力、资本、技术等传统要素并列为要素之一 。 与此同时 , 新基建横空出世 , 数据是新基建的基础 , 更是重要的生产资料 , 数据备份与恢复是新基建不可缺失的重要组成部分 。
数据作为生产要素登堂入室 , 爱数则先一步洞察风向 , 完成自我进化 。
2006年成立的爱数 , AnyBackup历经两次升级 , 2011年从备份市场进入灾备市场 , 2016年进入灾备数据服务市场 , 多年占据国产市场第一 , 2019年 , 爱数进一步完成了大数据基础设施战略的升级 , AnyBackup成为这一战略的基底 。