- 主题:openai这次o1不太行
我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
#发自zSMTH@CDU.MP
--
FROM 117.23.183.*
怎么不大行了?
【 在 VincentGe (VincentGe) 的大作中提到: 】
: 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
: #发自zSMTH@CDU.MP
: --
:
--
FROM 117.143.102.*
数学推导是怎么实现的?
【 在 VincentGe 的大作中提到: 】
: 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
: #发自zSMTH@CDU.MP
--
FROM 210.77.28.*
靠自推理,直观理解就是思维链的扩大化。
越是准确的前文越是能生成准确的后文
如果以前是问1+1等于几,直接回答 2
现在是 先思考你问什么,这是一个简单的加法,求和,然后再返回2,中间有思路有过程,这样有利于正确的答案的提出。由于我们很多文本都是去除脚手架后的,缺乏哪些深入的细节和思维过程,因此添加过程后自然高了。
细节上就是RL的扩大版,对于前文按照某种段落生成思维树,做搜索,然后训练,类似于下题的自博弈。
【 在 icome 的大作中提到: 】
:
: 数学推导是怎么实现的?
:
: 【 在 VincentGe 的大作中提到: 】
: : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
#发自zSMTH@CDU.MP
--
FROM 113.143.106.*
方向不太好,如果按照我的理解,这个模型最合适的地方是合成数据。
现在我们需要的不是一个知识模型,而是具备极高迁移学习能力的的小模型,只要这个模型出来,我们就可以彻底宣告AI时代来临
【 在 stevenwyy 的大作中提到: 】
:
: 怎么不大行了?
:
: 【 在 VincentGe (VincentGe) 的大作中提到: 】
: : 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
#发自zSMTH@CDU.MP
--
FROM 113.143.106.*
如果以前是问1+1等于几,直接回答 2
我的理解
如果问1000+1000
过去是搜索
现在是真算
【 在 VincentGe 的大作中提到: 】
: 靠自推理,直观理解就是思维链的扩大化。
: 越是准确的前文越是能生成准确的后文
: 如果以前是问1+1等于几,直接回答 2
: ...................
--
FROM 36.110.6.*
我没看现在大模型怎么搞
但数学推导与证明是AI上世纪六七十年代符号主义的优势
【 在 icome 的大作中提到: 】
: 数学推导是怎么实现的?
--
修改:pixYY FROM 111.36.201.*
FROM 111.36.201.*
昨天看微博上说还是没解决5.11>5.9这类问题
--
FROM 202.100.50.*
分解成子问题,再调用专门工具
这样就精准了
【 在 alpaca 的大作中提到: 】
: 昨天看微博上说还是没解决5.11>5.9这类问题
--
FROM 101.24.102.*
陶哲轩的评价还是挺高的。
相当于一个研究生助手。
【 在 VincentGe 的大作中提到: 】
: 我看了openai的表现,感觉这次这个模型不太行,基本上怎么训练我大体上已经理解了,但是感觉这个方向不太对
: #发自zSMTH@CDU.MP
--
FROM 114.92.109.*