科学探索|AlphaFold2 爆火背后 人类为什么要死磕蛋白质( 三 )


科学探索|AlphaFold2 爆火背后 人类为什么要死磕蛋白质
文章图片
得益于卷积神经网络的发展 , Deepmind 的研究在第十四届 CASP 比赛中大放异彩 , 团队使用基于注意力机制的神经网络 , 依靠端到端的优化整体构建结构 , 内置了大量的序列、结构和宏基因组等多重比较信息 , 其预测的 GDT-TS 中值达到了 92.4 分 , 远远高于第二名 。这是个什么水平呢?据悉 , GDT-TS 的得分在 70 分左右 , 说明其结果具有准确的全局和局部拓扑结构的模型 。超过 80 分 , 结构细节的建模越来越正确 , 超过 95 分 , 模型就像根据实验数据建立的模型一样准确 。
人工智能技术作为预测蛋白质结构的辅助手段 , 通过暴力的学习穷举 , 将科学家本来需要几年几十年预测的时间缩短为几日 , 并且对于简单的蛋白质分子来说结构的预测已经非常精准 , 而这样的结局就会让科学家们转身投入到深度理解蛋白质本身的机理的研究中 。
纵观科学史 , 每次科学家在所在领域内取得重大的进步 , 都离不开当时技术的支持 。无论是在蛋白质提纯的困难年代 , 还是观察蛋白质的冷电镜技术时代 , 科学家研究的工具都依赖于当时的最高科技水平 。在 AI 时代 , 因为算力和算法模型的极大提升 , 我们见证了蛋白质结构预测的历史时刻 。
【科学探索|AlphaFold2 爆火背后 人类为什么要死磕蛋白质】AlphaFold2 的数据库现已开源并且还在不断地增加新蛋白质结构预测 , 这也成为了科学家进行蛋白质研究的宝藏数据库 。不过算出结构也只是生物科学领域的初步阶段 , 指明了方向后续的进展还得需要试验与头脑的风暴 。对于没有在已有蛋白质结构数据集训练的其他蛋白质结构 , 其研究仍然是谜一般的存在 , 这也给科学家们留下了很大的研究空间 。
不过 AlphaFold2 这样的高精度模型 , 总的来说还是极大地推动科学家的研究与发展 , 拓展了对蛋白质进行功能分析、以及下游应用的范围 , 科学家们得以在各个领域展开开拓性的研究 , 比如一些癌症、病毒类感染的疾病研究 , 抗生素、靶向药的开发 , 研发新效率的酶等为健康与环保的层面做出贡献 。
站在神经网络与深度学习的技术巨人的肩膀上 , 生命科学领域的发展已经有了质的飞跃 , AI 对于蛋白质的预测也不再依赖人类的先验知识去做结构预测 , 相比几年前引起轰动的 AlphaGo , AlphaFold 也让深度学习与神经网络好好秀了把肌肉 。科学的创新离不开技术工具的强力辅助 , 而蛋白质这个能够影响生命进程的分子 , 技术为我们打开了研究它的大门 , 这些海量的蛋白质结构信息被技术释放 , 背后的解读与分析可能蕴含着生命信息的密码 。下一个生命科学领域的革命性研究成果 , 炸出来的是什么我们无法想象 。在生命科学研究中体验开盲盒的快乐 , 也是从来没有想过的惊喜 , 期待下一个未来 。