科学探索|存储新图谱:DNA存储的边界与天地( 二 )


佐治亚理工学院 (GTRI) 近期也公布了新进展,他们的团队设计了一种微芯片,可以显著提高以 DNA 形式写入数据的速度 。该团队预计将比当前的 DNA 存储技术提高 100 倍 。
研究机构的各种进展也使得嗅觉灵敏的投资机构风闻而来,中科碳元(深圳)、密码子(杭州)等创业公司获得数千万的天使轮融资 。
而政策方面,DNA 存储已经成为国家层面部署的重点发展方向 。国家“十四五”规划中提到要加快布局量子计算、量子通讯、神经芯片、DNA 存储等前沿技术 。我们可以看到,DNA 存储在政策、资本与技术的集中发力中开始蓄势待发,不过对于这类高精尖的技术来说,距离其真正的商业化落地进程还尚早 。
难以突破的结构性障碍
虽然 DNA 存储具有较为明显突出的优势,政策、资本等也在全方位的支持,应用的前景广阔,但商业化的进展仍然十分缓慢 。其最大屏障来自于其存储技术本身 。
为了便于理解 DNA 存储的面临的技术困境,我们简单介绍一下 DNA 存储数据的过程 。主要分为以下五个步骤:编码 —— 将数字信息编码为 DNA 序列;合成 —— 将序列融入实际的 DNA 分子;存储 —— 将合成的 DNA 片段保存在载体或细胞中;访问 —— 检索和选择性读取序列信息;解码 —— 将测定的序列信息转换回数字信息 。
在整个存储的过程中,编码与合成是 DNA 存储中较为关键和困难的环节 。尤其是 DNA 的合成过程最为艰辛,在碱基序列融入 DNA 分子的过程中,很容易随机损失掉合成的 DNA 。
而编码是 DNA 存储中成本与难度较大的环节,不过随着 AI、纳米微孔等技术的发展,编码环节的难度与成本都开始逐渐降低 。
DNA 存储的合成过程使得数据输入和读取的效率无法提上去,花费的时间较长、成本较高 。据佐治亚理工学院 2021 年 12 月披露的信息称,DNA 存储速度提升到了每天写入 20GB 数据,这是目前已知 DNA 存储最快的写入速度,而目前固态硬盘的读写速度最快大约为每秒 500MB 。
成本方面,2017 年哥伦比亚大学的实验显示,合成 2MB 的 DNA 数据需要 7000 美元,而读取数据需要 2000 美元,如果用户需要以 DNA 形式储存 1GB 的电影,编码大约需要花费 358 万美元,而读取数据还需要 102 万美元 。DNA 存储技术的读写速度与成本,大大制约了其规模商业化的发展 。
另外一个较大的影响因素跟科研人才相关,由于 DNA 存储技术领域的强学科交叉性,必须依靠计算机、生物、化学、数学等多个相关学科的协同,这也就对科研人才的复合能力水平要求较高 。
当然除了技术的进阶、人才的需求以外,存储的便携式要求也是其较为重要的发展方向需求 。对于这类高精尖技术的设备,传统的设备都较为笨重,便携式的优化也困难重重 。总的来说,DNA 存储的各个环节都有较多的难关需要克服,DNA 存储真正意义上的走入商业市场,进一步发展成为主流的存储设备,还需要长时间的沉淀,才能让 DNA 存储技术有实质的进阶 。
终极存储:深空与亘古
对于数据的存储来说,多元化、智能化、绿色化是其主要的发展风向标,尤其是绿色的数据中心是主推的发展方向 。
据研究机构预测,若能源利用效率得不到持续提高,数据存储用电量到 2030 年可能增长到全球用电总量的 3% 至 13% 。数据存储的能源功耗令人担忧,降低能耗将成为数据中心建设的首要目标,存储设备作为数据中心中最为耗能的设备,成为革新的排头兵 。
目前改进常见的思路是从存储设备的硬件层面进行考量,如架构设计、芯片、硬盘介质等 。而 DNA 存储可谓是存储的终极进化方向 。据悉,麻省理工学院生物工程教授 MarkBathe 称,理论上,一个装满 DNA 的咖啡杯就可以存储世界上所有的数据 。如果未来可以实现,DNA 存储一定会革新存储领域的格局 。