给AI补数学课 人工智能可证实数学数据库中82%的问题了

2022-05-26 14:40:28 来源:网络

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

不得不说,科学家们最近都在痴迷给AI补数学课了。

这不,脸书团队也来凑热闹,提出了一种新模型,能完全自动化论证定理,并显著优于SOTA。

要知道,随着数学定理愈加复杂,之后再仅凭人力来论证定理只会变得更加困难。

因此,用计算机论证数学定理已经成为一个研究焦点。

此前OpenAI也提出过专攻这一方向的模型GPT-f,它能论证Metamath中56%的问题。

而这次提出的最新方法,能将这一数字提升到82.6%

与此同时,研究人员表示该方法使用的时间还更短,与GPT-f相比可以将计算消耗缩减到原本的十分之一。

难道说这一次AI大战数学,是要成功了?

还是Transformer

本文提出的方法为一种基于Transformer的在线训练程序。

大致可以分为三步:

第一、在数学证明库中预训练;

第二、在有监督数据集上微调策略模型;

第三、在线训练策略模型和判断模型。

具体来看是利用一种搜索算法,让模型在已有的数学证明库中学习,然后去推广证明更多的问题。

其中数学证明库包括3种,分别是Metamath、Lean和自研的一种证明环境。

这些证明库简单来说,就是把普通数学语言转换成近似于编程语言的形式。

Metamath的主库是set.mm,包含基于ZFC集合论的约38000个证明。

Lean更为人熟知的,是微软那个可以参加IMO赛事的AI算法。Lean库就是为了教会同名算法所有的本科数学知识,并让它学会证明这些定理。

这项研究的主要目标,是为了构建一个证明器,让它可以自动生成一系列合适的策略去论证问题。

为此,研究人员提出了一个基于MCTS的非平衡超图证明搜索算法。

MCTS译为蒙特卡洛树搜索,常用于解决博弈树问题,它因为AlphaGo所被人熟知。

它的运行过程,就是通过在搜索空间中随机抽样来找寻有希望的动作,然后根据这个动作来扩展搜索树。

本项研究采用的思路类似于此。

搜索证明过程从目标g开始,向下搜索方法,逐步发展成一个超图(Hypergraph)。

当出现一个分支下出现空集时,就意味着找到了一个最优证明。

最后,在反向传播过程中,记下超树的节点值和总操作次数。

在这个环节中,研究人员假设了一个策略模型和一个判断模型。

策略模型允许判断模型进行抽样,判断模型可以评估当前策略找到证明方法的能力。

整个搜索算法,就以如上两个模型作为参照。

而这两个模型都是Transformer模型,且权值共享。

接下来,就到了在线训练的阶段。

这个过程中,控制器会将语句发送给异步HTPS验证,并收集训练和证明数据。

然后验证器会将训练样本发送给分布式训练器,并定期同步其模型副本。

实验结果

在测试环节,研究人员将HTPS与GPT-f进行了比较。

后者是OpenAI此前提出的数学定理推理模型,同样基于Transformer。

结果表明,在线训练后的模型可以证明Metamath中82%的问题,远超GPT-f此前56.5%的记录。

在Lean库中,这一模型可以证明其中43%的定理,比SOTA提高了38%,以下是该模型证明出的IMO试题。

不过目前它还不是十全十美。

比如在如下这道题中,它并没有用最简便的办法解出题目,研究人员表示这是因为注释中出现了错误。

One More Thing

用计算机论证数学问题,四色定理的证明便是最为人熟知的例子之一。

四色定理是近代数学三大难题之一,它提出“任何一张地图只用四种颜色就能使具有共同边界的国家,着上不同的颜色”。

由于这一定理的论证需要大量计算,在它被提出后100年内,都没有人能完全论证。

直到1976年,在美国伊利诺斯大学两台计算机上,经过1200小时、100亿次判断后,终于可以论证任何一张地图都只需要4种颜色来标记,由此也轰动了整个数学界。

加之随着数学问题愈加复杂,用人力来检验定理是否正确也变得更加困难。

近来,AI界也把目光逐步聚焦在数学问题上。

2020年,OpenAI推出数学定理推理模型GPT-f,可用于自动定理证明。

这一方法可完成测试集中56.5%的证明,超过当时SOTA模型MetaGen-IL30%以上。

同年,微软也发布了可以做出IMO试题的Lean,这意味着AI能做出没见过的题目了。

去年,OpenAI给GPT-3加上验证器后,做数学题效果明显好于此前微调的办法,可以达到小学生90%的水平。

今年1月,来自MIT+哈佛+哥伦比亚大学+滑铁卢大学的一项联合研究表明,他们提出的模型可以做高数了。

总之,科学家们正在努力让AI这个偏科生变得文理双全。

,给AI补数学课 人工品牌加盟 智能可证实数学数据库中82%的问题了

相关:

传特斯拉正筹备进军泰国市场 发卖电动车和电池等据外媒报道,特斯拉已提交进入泰国市场的申请,作为该公司最新的市场扩张举措。值得注意的是,特斯拉不仅计划在泰国销售电动汽车,还计划销售电池和太阳能产品。特斯拉已经有一段时间没有进军新市场了。多年来,特斯拉一直努力进入印度市场,但该计划在本月早些时候被搁置。现在,特斯拉似乎已经将注意力转向了泰国市场。根据社交媒体上流传的一份新文件,特斯拉已经提交了在泰国销售其产品的申请。虽然特斯拉还没有正式进入泰国..

李开复:关于人工智能的“电车难题”的崭新思虑本文为创新工场董事长兼首席执行官李开复博士在本周于瑞士召开的2022年达沃斯世界经济论坛的专栏文章,经授权编译。图片来源: Unsplash/Gabriella Clare Marino负责任地应用机器人和机器学习可以挽救更多的生命,其利大于弊。自主机器人和自主决策的确可能造成致命错误。因机器人错误而造成的死亡,将造成道德两难的新时代“电车难题”。如果社会接受机器学习,并竭力以负责任的态度导入机器人技术,更多生命将会因此得到拯..

差人下班吃着雪糕 随手抓住1名嫌疑人5月23日,湖北襄阳派出所一位民警与另一位辅警下班后在路上买了根雪糕边吃边走与一名骑三轮的男子擦肩而过时民警觉得男子很像近日追踪的盗窃电瓶嫌疑人便立刻追上将其拦截经核查该男子确实为最近正在追捕的盗窃嫌疑人自动播放网友:火眼金睛!

上海男人私行安设多名抗原阳性工人 造成疫情传布5月26日,上海市公安局发布警情通报:近日,浦东公安分局查处一起妨害传染病防治案,犯罪嫌疑人刘某某(男,34岁)已被警方依法采取刑事强制措施。经查,某建筑公司项目经理刘某某在获悉其负责的曹路地区某工地多名工人自测新冠抗原阳性后,不仅未向有关部门上报,而且擅自将相关人员安置在工地内不具备隔离条件的临时宿合,并不再安排上述人员参加核酸检测。5月15日,防疫部门发现该工地异常情况后,立即开展排查,发现工地内多..

王毅与所罗门群岛代总督接见会面:等候中所关系后发先至当地时间2022年5月26日,所罗门群岛代总督奥蒂在霍尼亚拉总督府会见正在访所的国务委员兼外长王毅。奥蒂说,所罗门群岛政府和人民都高度重视对华关系。所中建交以来,两国关系发展取得长足进展,中国代表团此访将为所中合作带来新亮点、注入新动力。感谢中方为所方基础设施建设和抗击疫情提供的宝贵支持,中方援建的太平洋运动会体育馆将助力所罗门群岛首次承办大型国际赛事,所运动健儿也第一次有机会在本国土地上与各国运动员..

普京签定法令简化乌两地居平易近插手俄国籍轨范 乌方回应俄罗斯总统普京当地时间5月25日,俄罗斯总统普京签署了一项关于简化乌克兰扎波罗热州和赫尔松州两地居民获得俄罗斯公民身份程序的法令,该法令已于当日生效。据法新社5月25日报道,目前整个赫尔松州和扎波罗热州部分地区由俄军控制。赫尔松州军民政府副主席基里尔·斯特列穆索夫(Kirill Stremousov)称:“在相关程序简化后,我们能清楚地看到,俄罗斯将永远存在于赫尔松州。”斯特列穆索夫透露,申请获得俄公民身份者不需要有..

赵倬霆:演员有时没平安感,但我想坚持演下去  热播剧《且试天下》迎来会员收官,剧中饰演墨羽骑大将军任穿云的演员是北京电影学院毕业生赵倬霆。任穿云的戏份并非贯穿始终,但却收获了很多观众的好评,赵倬霆说自己经常会开着弹幕去追剧,他发现观众的角度总是很新奇,“比如我去买马的那场戏,我看好多人都在换算一匹马是多少钱,大家的脑洞都很大。”   《且试天下》合作杨洋感叹其认真   在看《且试天下》小说时,赵倬霆就觉得剧中的任穿云很适合自己,想争取出演..

青海省首个“15分钟核酸检测圈”在湟源建成  中新网西宁5月26日电(祁增蓓)26日,记者从西宁市湟源县委宣传部获悉,25日晚,历时30多个小时的长途运输,满载江苏省南京市六合区深切情谊的首批移动式“核酸采样小屋”顺利抵达湟源县,并连夜安装布置在该县各乡镇。至此,青海省首个“15分钟核酸检测圈”在西宁市湟源县建成。   5月6日,西宁市湟源县发现1名新冠肺炎病毒阳性感染者。此后该县开展了多轮全员核酸检测。   据介绍,这批“核酸采样小屋”共计40座,价..

北京互联网法院:充值打赏类案件占涉未成年人收集纠缠75%  充值打赏类占比涉未成年人网络纠纷75%。5月26日,北京互联网法院发布未成年人网络司法保护情况报告。   报告显示,自2018年9月成立以来,北京互联网法院共受理涉未成年人网络纠纷76件。从纠纷类型来看,包括网络服务合同纠纷60件,占比79.0%;网络侵权纠纷8件,占比10.5%,信息网络买卖合同纠纷8件,占比10.5%,纠纷类型集中度较高。从主体看,未成年人作为原告的案件数量为67件,未成年人为被告的案件数量为9件。从年龄..

桂林警方成功侦破一路合同诈骗案 涉案价值近万万元  中新网桂林5月26日电(黄炎 唐梦宪)广西桂林市公安局象山分局5月26日向媒体通报,象山警方5月22日成功侦破“5.19”合同诈骗案,先后抓获犯罪嫌疑人2名,追回奔驰、宝马、奥迪、大众、丰田等品牌轿车、越野车22辆,最大程度为企业追赃挽损。   5月19日,象山公安分局民警在企业挂钩包联工作走访中了解到,两名男子以跑业务需要长期用车为名,先后在象山辖区某汽车租赁公司租赁了33辆奔驰、宝马、奥迪、大众、丰田等品牌..