科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%

MIT最近更新了他们的高等数学的求解器,通过程序合成的方式在七门大学数学课程中正确率达到了81%!而且还能对求解过程进行解释、绘图,还能生成新问题!不光玩小学数学应用题,AI已经开始攻克高数了!

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

最近MIT的研究人员宣布他们基于OpenAI Codex预训练模型,在本科生级别的数学问题上通过few-shot learning成功达到81%的正确率!


科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

论文链接:https://arxiv.org/abs/2112.15594
代码链接:https://github.com/idrori/mathq
先来几个小问题看看答案,比如计算单变量函数的图形绕轴旋转产生的体积、计算洛伦茨吸引子及投影、计算和描绘奇异值分解(SVD)的几何形状,不光能正确解答,还能给出对应的解释!

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

确实是逆了天了,忆往昔,高数及格都是飘过,如今AI一出手就能拿81分,我单方面宣布AI已经超越人类了 。

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

更牛的是,除了能解决普通机器学习模型难以解决的问题外,这项研究还表明该技术可以大规模推广,可以解决所属课程及类似的课程问题 。
这也是历史上首次,单个机器学习模型能够解决如此大规模的数学问题,而且还能对问题的解答过程进行解释、绘图,甚至还能生成新问题!
实际上这篇论文早在年初就发布出来了,经过半年的修改后,从114页的篇幅增加到181页,能解决的数学问题更多了,附录的编号从A-Z直接拉满 。

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

文章的作者单位主要有四个,分别为麻省理工学院、哥伦比亚大学、哈佛大学和滑铁卢大学 。
第一作者Iddo Drori是MIT的电气工程与计算机科学系AI部门讲师、哥伦比亚大学工程和应用科学学院的兼任副教授 。曾获得CCAI NeurIPS 2021最佳论文奖 。

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

他的主要研究方向为教育机器学习,即试图让机器解决,解释和生成大学级数学和STEM课程;气候科学的机器学习,即根据数千年的数据预测极端气候变化并监测气候,融合多学科的工作来预测大西洋多年来海洋生物地球化学的变化;自动驾驶的机器学习算法等 。
他也是剑桥大学出版社出版的The Science of Deep Learning的作者 。
高等教育里程碑
在这篇论文之前,大部分研究人员都认为神经网络无法处理高数问题,只能解决一些简单的数学题 。
即便Transformer模型在各种各样的NLP任务中超越人类的性能,在解决数学问题上仍然没有不行,主要原因还是因为各种大模型如GPT-3都是只在文本数据上进行预训练 。
后来有研究人员发现,以逐步解析的方式(chain of thoughts)还是可以引导语言模型来推理回答一些简单的数学问题,但高等数学问题就没这么容易解决了 。

科学探索|MIT发布加强版“高数”求解器:7门课程正确率达81%
文章图片

当目标瞄准为高数问题后,首先就得搜集一波训练数据 。
作者从麻省理工学院的七门课程中各随机抽出25个问题,包括
18.01单变量微积分
18.02多变量微积分
18.03微分方程
18.05概率和统计学概论
18.06线性代数