清华大学发布首个开源自动图学工具包

如何应用自动机器学习 (AutoML) 加速图机器学习任务的处理?清华大学发布全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning) , 支持在图数据上全自动进行机器学习 。
人工智能的蓬勃发展离不开数据、算力、算法这三大要素 。而在浩瀚的数据中 , 有一种数据结构既普遍又复杂 , 它就是图(graph) 。
图是一种用于描述事物之间关系的结构 , 其基本构成元素为节点和连接节点的边 。
很多不同领域的研究问题都可以很自然地建模成图机器学习 , 例如蛋白质建模、物理系统模拟、组合优化等基础研究;社交媒体分析、推荐系统、虚假新闻检测等互联网应用;以及金融风控、知识表征、交通流量预测、新药发现等 。
图结构丰富且具有与生俱来的导向能力 , 因此非常适合机器学习模型 。同时 , 它又无比复杂 , 难以进行大规模扩展应用 。而且不同的图数据在结构、内容和任务上千差万别 , 所需要的图机器学习模型也可能相差甚远 , 这就导致不同任务的模型自动化面临巨大挑战 。如何设计最优的图自动机器学习模型 , 是一个尚未解决的难题 。
图 + AutoML = ?
自动机器学习 (AutoML) 旨在将机器学习的过程自动化 , 在降低机器学习使用门槛的同时 , 提升机器学习的效果 。但现有的自动机器学习工具 , 无法考虑图数据的特殊性 , 因此无法应用在图机器学习模型中 。
为了解决该问题 , 清华大学朱文武教授带领的网络与媒体实验室发布了全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning) 。该工具支持在图数据上全自动进行机器学习 , 并且支持图机器学习中最常见的两个任务:节点分类任务(node classification)与图分类任务(graph classification) 。

清华大学发布首个开源自动图学工具包 清华大学发布首个开源自动图学工具包

文章插图

    推荐阅读