孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据


科学家提出的扩展核酸存储器方案将存储密度提升数倍 , 达到惊人的每立方厘米630EB 。 一部手机的体积就能存储2020年全世界一年的数据 , 而2040年(10^24位 , 1YB)的预计存储需求能够放进100×100×10立方厘米的盒子中 。
人类每天都在创造大量的数据 。 据IDC发布的报告 , 全球每年产生的数据将从2018年的33ZB增长到2025年的175ZB , 相当于每天产生491EB的数据 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
我们先了解一下数据单位 1B(Byte 字节)=8b(bit 位) 1KB(Kilobyte 千字节)=1024B 1MB(Megabyte 兆字节)=1024KB 1GB(Gigabyte 吉字节)=1024MB 1TB(Trillionbyte太字节)=1024GB 1PB(Petabyte拍字节)=1024TB 1EB(Exabyte艾字节)=1024PB 1ZB(Zettabyte泽字节)=1024EB 1YB(Yottabyte尧字节)=1024ZB
今年一季度 , 存储服务商Backblaze回顾了自己的12万块硬盘的可靠性 , 三大品牌硬盘的综合年化故障率为1.07% 。 硬盘的理论寿命是3万小时以上 , 有些可能多至10多年 , 而有些可能不足1年 。 不管怎样 , 硬盘的寿命不够长 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
机械硬盘
此外 , 随着信息量呈指数增长 , 制造存储设备的原料可能面临短缺 。
我们使用以硅(从沙子中提炼出来)为主要元素制成的微芯片来收集、处理和存储数据 。 硅是地壳中第二丰富的元素 , 但用来生产高纯度硅的矿产却不是很多 , 只占硅总量的不足10% 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
硅晶圆
一项研究表明 , 到2040年 , 海量数据可能会耗尽全球计算机用硅 。 改进硅的提炼工艺是解决方案之一 , 但是面临成本问题 。 此外 , 其他替代材料 , 如氧化镓、二硒化铪、二硒化锆和石墨烯等 , 进展缓慢 。
除了上述材料 , 脱氧核糖核酸(DNA)带来了新的希望 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
DNA形象图
生物体利用核苷酸形成长链 , 也就是RNA和DNA , 来编码和存储蛋白质信息 。 人类每一个细胞中都包含一份DNA , 而这份DNA的数据量大概相当于3GB 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
DNA显微照片利用DNA来存储数据
目前最先进的计算机硬盘的存储密度大约是每立方厘米1.25TB 。 而标准的DNA存储器在相同的体积的存储能力是硬盘的1百万倍 , 即1250000TB , 或1250PB , 1.25EB 。 一个小行李箱就能够存储全年的数据量 。 作为对比 , 2019年全年机械硬盘出货量是3.2亿块 , 固态硬盘2.4亿块 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
固态硬盘
DNA之所以有如此高的存储密度 , 部分原因是DNA有4个基本单位:核苷酸 , 分别是G , A , T和C(鸟嘌呤 , 腺嘌呤 , 胸腺嘧啶和胞嘧啶) , 而计算系统目前使用的是基于0和1的二进制系统 。 进制的倍增能够使存储信息量呈“指数级增长” 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
最近 , 印度科学家提出了一种新的编码方案 , 称为扩展核酸存储器(NAM) , 极大的提高了单位体积可存储容量 , 这可能是数据存储技术的未来 。
加尔各答的Meghnad Saha理工学院的计算机专家添加了两对新的非标准核苷酸 , 分别是Ds-Px(thienylimidazopyridine和nitropropynylpyrrole)和Im-Na(imidazopyrimidine和naphthyridine) 。分页标题
核苷酸总数量达到4对 , 扩展核酸存储器的存储密度将提高许多倍 , 每立方厘米超过630EB 。 一部手机的体积就能存储2020年全世界一年的数据 , 而2040年(10^24位 , 1YB)的预计存储需求能够放进100×100×10立方厘米的盒子中 。 许多文章提到DNA存储理论上最大可以达到每克455EB , 这实际上是不准确的 。 这个计算方法只计算DNA本身的重量 , 实际上一个存储系统需要其他读取和写入组件 , 这将显著降低存储密度 。 在本文的数据中 , 科学家假设扩展核酸存储器的存储密度大概相当于大肠杆菌的DNA数据密度 。 除了存储密度以外 , DNA存储还具有许多其他优势 。
耐用性:DNA 可保存很长时间 - 如果低温保存 , 可保存数百万年 。 相比之下 , 常用的长期存储介质 - 磁带 , 在使用10年后就必须被更换 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
从古生物骨骼中提取DNA
能耗:DNA存储器在存储、处理和读取过程中所需的能耗非常低 。 根据计算 , DNA存储能耗仅为flash闪存的1/10000000~1/1000000000 。
可持续性:DNA可由生物体制造 , 可以完全回收利用 , 意味着几乎可以获得无限原料 。 面临的技术挑战
DNA读取和写入数据的速度慢于其他类型的存储技术 。 短期内用于高速存储设备是不现实的 。 DNA存储最有希望首先用于对速度要求不高的场合 , 比如替代用于长期存储数据的磁带设备 。
成本是另一个重要问题 。 目前在实验室环境中 , 合成2MB数据的成本是7000美元 , 读取数据需要2000美元 。

孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据
本文插图
好消息是 , DNA测序的费用正在持续大幅下降 , 从2002年的31250美元/兆碱基下降至2016年的63美分/兆碱基 。 目前多个研究团体正在发展基于DNA的数据存储技术 。 假以时日 , 这些难题将会得到解决 。 光明的未来
【孜然实验室|DNA存储器突破了理论极限,一部手机装下全世界的数据】如果硅消耗殆尽 , 可能会使世界陷入停滞 。 鉴于我们产生数据的增长速度 , 这是一个迫切需要解决的问题 。 DNA存储器也许就是未来的终极解决方案 。