openai这次o1不太行

水木社区手机版

主题:openai这次o1不太行
楼主|VincentGe|2024-09-13 15:01:03|只看此ID
我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对
#发自zSMTH@CDU.MP
--
FROM 117.23.183.*
1楼|stevenwyy|2024-09-13 22:03:39|只看此ID
怎么不大行了？

【在 VincentGe (VincentGe) 的大作中提到: 】
:  我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对
:  #发自zSMTH@CDU.MP
:  --
:
--
FROM 117.143.102.*
2楼|icome|2024-09-14 08:18:37|只看此ID
数学推导是怎么实现的？

【在 VincentGe 的大作中提到: 】
: 我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对
: #发自zSMTH@CDU.MP
--
FROM 210.77.28.*
3楼|VincentGe|2024-09-14 11:08:45|只看此ID
靠自推理，直观理解就是思维链的扩大化。

越是准确的前文越是能生成准确的后文

如果以前是问1+1等于几，直接回答 2
现在是先思考你问什么，这是一个简单的加法，求和，然后再返回2，中间有思路有过程，这样有利于正确的答案的提出。由于我们很多文本都是去除脚手架后的，缺乏哪些深入的细节和思维过程，因此添加过程后自然高了。

细节上就是RL的扩大版，对于前文按照某种段落生成思维树，做搜索，然后训练，类似于下题的自博弈。

【在 icome 的大作中提到: 】
:
: 数学推导是怎么实现的？
:
: 【在 VincentGe 的大作中提到: 】
: : 我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对

#发自zSMTH@CDU.MP
--
FROM 113.143.106.*
4楼|VincentGe|2024-09-14 11:10:40|只看此ID
方向不太好，如果按照我的理解，这个模型最合适的地方是合成数据。

现在我们需要的不是一个知识模型，而是具备极高迁移学习能力的的小模型，只要这个模型出来，我们就可以彻底宣告AI时代来临

【在 stevenwyy 的大作中提到: 】
:
: 怎么不大行了？
:
: 【在 VincentGe (VincentGe) 的大作中提到: 】
: : 我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对

#发自zSMTH@CDU.MP
--
FROM 113.143.106.*
5楼|lioncat7|2024-09-14 16:15:03|只看此ID
如果以前是问1+1等于几，直接回答 2

我的理解
如果问1000+1000
过去是搜索
现在是真算
【在 VincentGe 的大作中提到: 】
: 靠自推理，直观理解就是思维链的扩大化。
: 越是准确的前文越是能生成准确的后文
: 如果以前是问1+1等于几，直接回答 2
: ...................
--
FROM 36.110.6.*
6楼|pixYY|2024-09-14 18:33:38|只看此ID
我没看现在大模型怎么搞

但数学推导与证明是AI上世纪六七十年代符号主义的优势

【在 icome 的大作中提到: 】
: 数学推导是怎么实现的？
--
修改:pixYY FROM 111.36.201.*
FROM 111.36.201.*
7楼|alpaca|2024-09-14 19:14:23|只看此ID
昨天看微博上说还是没解决5.11>5.9这类问题
--
FROM 202.100.50.*
8楼|ZHMZFFL|2024-09-14 21:14:19|只看此ID
分解成子问题，再调用专门工具
这样就精准了

【在 alpaca 的大作中提到: 】
: 昨天看微博上说还是没解决5.11>5.9这类问题
--
FROM 101.24.102.*
9楼|granis|2024-09-16 10:08:48|只看此ID
陶哲轩的评价还是挺高的。
相当于一个研究生助手。

【在 VincentGe 的大作中提到: 】
: 我看了openai的表现，感觉这次这个模型不太行，基本上怎么训练我大体上已经理解了，但是感觉这个方向不太对
: #发自zSMTH@CDU.MP
--
FROM 114.92.109.*