- 主题:Google推出Alpha Geometry,数学几何能力已接近人类奥赛选手 (
【 以下文字转载自 NewExpress 讨论区 】
发信人: topgenius (87.53%), 信区: NewExpress
标 题: Google推出Alpha Geometry,数学几何能力已接近人类奥赛选手
发信站: 水木社区 (Thu Jan 18 08:32:38 2024), 站内
Google 推出了新的面向数学几何领域的模型 Alpha Geometry,数学几何能力已接近人类奥林匹克金牌选手的水平。
特别值得一提的是:它的训练是基于合成数据而不是现有的数据。
它训练的方式很有特别:先初始生成了十亿个随机几何图形,并全面分析了每个图形中点和线的所有关系。AlphaGeometry 找出了每个图形中所有的证明,并反向追溯出为得到这些证明所需添加的额外几何元素(如果有的话)。
按照谷歌的说法,AlphaGeometry 结合了神经语言模型和符号演绎引擎的优势,形成了一个神经符号系统。这个系统能够共同工作,为复杂的几何定理找到证明。就像“快速思考和慢速思考”理论中所述,一个系统快速提供“直觉”式的想法,而另一个则负责更谨慎、理性的决策。
语言模型擅长快速识别数据中的常规模式和关系,能够迅速预测可能有用的结构,但它们通常缺乏严谨的推理能力和解释决策的能力。而符号演绎引擎则基于正规逻辑,使用明确的规则来得出结论。这些引擎是理性的、可解释的,但在单独处理大型复杂问题时可能显得“慢”且不够灵活。
简单来说就是大语言模型快速思考提出各种可能(包括幻觉)——大胆假设,推理引擎负责慢思考对快速思考的结果进行推理验证——小心求证。
具体到图二这样的一个几何题的例子,大语言模型提出方案,推理引擎验证,验证不通过就继续改进方案或者提出新方案,直到找到最终解决方案。
这无疑将为未来人工智能的发展,尤其是对于解决大语言模型幻觉和语料不足的问题提供新的思路。
--
FROM 117.147.13.*
昨天夜里看了这篇paper,他们选择题目的限制还挺大的,只能是纯粹的平面几何,并且排除了所有包含不等式的命题,以及组合几何,我猜是太难没搞定...
【 在 harrycheng 的大作中提到: 】
: 【 以下文字转载自 NewExpress 讨论区 】
: 发信人: topgenius (87.53%), 信区: NewExpress
: 标 题: Google推出Alpha Geometry,数学几何能力已接近人类奥赛选手
: ...................
--
FROM 61.149.73.24
可以了,一步步来吧。
他们现在的方法可以保证证明准确性吗?
【 在 annals 的大作中提到: 】
: 昨天夜里看了这篇paper,他们选择题目的限制还挺大的,只能是纯粹的平面几何,并且排除了所有包含不等式的命题,以及组合几何,我猜是太难没搞定...
:
--
FROM 202.120.11.*
正确性是通过交互式证明工具来保证的,大概过程就是用神经网络去猜测一个新结论,然后让这个外部的验证器来确定猜得对不对,直到达成最终目标..所以没做出来的题目属于没有在有限次数内找到路线的
【 在 vinbo 的大作中提到: 】
: 可以了,一步步来吧。
: 他们现在的方法可以保证证明准确性吗?
--
FROM 61.149.73.24
我以为是给题直接出证明。。。
【 在 annals 的大作中提到: 】
: 正确性是通过交互式证明工具来保证的,大概过程就是用神经网络去猜测一个新结论,然后让这个外部的验证器来确定猜得对不对,直到达成最终目标..所以没做出来的题目属于没有在有限次数内找到路线的
:
--
FROM 202.120.11.*
你意思就只能整个解析几何呗?
【 在 annals 的大作中提到: 】
: 昨天夜里看了这篇paper,他们选择题目的限制还挺大的,只能是纯粹的平面几何,并且排除了所有包含不等式的命题,以及组合几何,我猜是太难没搞定...
:
--
FROM 106.121.187.*
能解决那种跨领域的题么,类似代数拓扑那种,或由几何转换到代数的那种题能解么
【 在 annals 的大作中提到: 】
: 昨天夜里看了这篇paper,他们选择题目的限制还挺大的,只能是纯粹的平面几何,并且排除了所有包含不等式的命题,以及组合几何,我猜是太难没搞定...
:
--
FROM 106.121.187.*
他们没有用解析几何的算法,比较像初中的那种纯碎用逻辑推理
【 在 Haken1 的大作中提到: 】
: 你意思就只能整个解析几何呗?
--
FROM 61.149.73.24
这就敢说接近imo金牌?看来标题党也不是我国特产,也可能是翻译成我国新闻后加的标题
【 在 annals 的大作中提到: 】
: 昨天夜里看了这篇paper,他们选择题目的限制还挺大的,只能是纯粹的平面几何,并且排除了所有包含不等式的命题,以及组合几何,我猜是太难没搞定...
--
修改:gtgtjing FROM 123.113.84.*
FROM 123.113.84.*
应该不行,他们的transformer是专门针对平面几何题优化的
【 在 Haken1 的大作中提到: 】
: 能解决那种跨领域的题么,类似代数拓扑那种,或由几何转换到代数的那种题能解么
--
FROM 61.149.73.24