AI|MIT科学家创建新机器学习模型:开发新药的更明智方式

制药公司正在使用人工智能来简化发现新药的过程 。机器学习模型可以提出具有特定特性的新分子,这些特性可以对抗某些疾病,在几分钟内完成人类可能需要几个月才能实现的手动操作 。但是,有一个主要障碍阻碍了这些系统的发展 。这些模型经常建议新的分子结构在实验室中难以或不可能产生 。如果化学家无法实际制造分子,就无法测试其抗病特性 。

AI|MIT科学家创建新机器学习模型:开发新药的更明智方式
文章图片

麻省理工学院研究人员的一种新方法限制了机器学习模型,因此它只建议可以合成的分子结构 。该方法保证了分子是由可以购买的材料组成的,并且这些材料之间发生的化学反应遵循化学规律 。
与其他方法相比,他们的模型提出的分子结构在流行的评价中得分很高,甚至更高,同时也保证可以合成 。他们的系统还需要不到一秒钟的时间来提出一个合成途径,而其他单独提出分子然后评估其合成能力的方法可能需要几分钟 。在拥有数十亿潜在分子的搜索空间中,这些时间的节省会增加 。
“这个过程重新制定了我们如何要求这些模型产生新的分子结构 。许多这些模型认为要逐个原子或逐个键建立新的分子结构 。相反,我们正在逐个构件和逐个反应来构建新的分子,”麻省理工学院化学工程系和电子工程与计算机科学系的亨利-斯莱辛格职业发展副教授、该论文的资深作者Connor Coley说 。
与Coley一起撰写该论文的还有第一作者研究生高文浩和博士后Rocío Mercado 。该研究最近在国际学习表征会议上发表 。
为了创建一个分子结构,该模型模拟了合成一个分子的过程,以确保它能够被生产 。该模型得到了一套可行的构建模块,即可以购买的化学品,以及一个有效的化学反应列表,以便进行操作 。这些化学反应模板是由专家手工制作的 。通过只允许某些化学品或特定反应来控制这些输入,使研究人员能够限制一个新分子的搜索空间有多大 。
该模型使用这些输入来构建一棵树,通过选择构件并通过化学反应将它们连接起来,一次一个,来构建最终的分子 。在每个步骤中,随着更多的化学品和反应的加入,分子变得更加复杂 。
它既能输出最终的分子结构,又能输出合成它的化学品和反应树 。“我们不是直接设计产品分子本身,而是设计一个行动序列来获得该分子 。这使我们能够保证结构的质量,”研究人员说 。
为了训练他们的模型,研究人员输入一个完整的分子结构和一组构建模块和化学反应,模型学习创建一个合成分子的树 。在看到几十万个例子后,该模型学会了自己想出这些合成途径 。
分子优化
经过训练的模型可用于优化 。研究人员定义了他们希望在最终分子中实现的某些特性,给定了某些构件和化学反应模板,模型就会提出一个可合成的分子结构 。
【AI|MIT科学家创建新机器学习模型:开发新药的更明智方式】“令人惊讶的是,用这么小的模板集,你实际上可以复制出很大一部分的分子 。你不需要那么多的构件来产生大量的可用化学空间供模型搜索,” Mercado说 。
他们通过评估该模型重建可合成分子的能力来测试该模型 。它能够重现这些分子中的51%,并且重现每个分子的时间不到一秒钟 。他们的技术比其他一些方法更快,因为模型没有在树上的每一步中搜索所有的选项 。研究人员解释说,它有一套确定的化学品和反应来工作 。
当他们用他们的模型提出具有特定属性的分子时,他们的方法提出了更高质量的分子结构,这些分子结构比其他方法的分子具有更强的结合亲和力 。这意味着这些分子将能更好地附着在蛋白质上,并阻止某种活动,如阻止病毒复制 。