Re: DS V2.5 V3 R1的幻觉率分别是2.4% 3.9% 14.3% 为何越新的模

水木社区手机版

主题:Re: DS V2.5 V3 R1的幻觉率分别是2.4% 3.9% 14.3% 为何越新的模
楼主|Xjt|2025-02-24 13:35:19|只看此ID
R1会thinking，本质也是output，输出越多就越容易出幻觉。你如果和孩子聊天就知道了，你直接问什么基本没问题。你让孩子自己先分析和描述一段话，然后慢慢他就会自己产生幻觉，编出很多奇怪的东西。

大模型无论训练还说output和儿童都非常相似
【在 anylinkin 的大作中提到: 】
: 来源：huggingface vectara
: 为什么越后面的模型，幻觉率越高？ R1甚至还出现了一个断崖式的降低？
: 其他的大模型，基本上都是越新的模型，幻觉率越低。
: ...................
--
修改:Xjt FROM 202.47.106.*
FROM 202.47.106.*
1楼|Xjt|2025-02-24 14:49:58|只看此ID
估计DS对幻觉没做很好的RL优化呗。我觉得这思路是非常正确的。幻觉应该用RAG解决而不是强行压制幻觉。等于压制了儿童的创造力
【在 anylinkin 的大作中提到: 】
: 应该和 reansoning 无关。
: 其他模型，同一个系列的，都是越新的模型，幻觉率越低。
:
--
FROM 202.47.106.*
2楼|Xjt|2025-02-24 14:59:24|只看此ID
我仔细看了下，对这个测试的准确性存疑

OpenAI的o1是准备的幻觉多，而且我自己用的时候也感觉幻觉很多。但是居然得分很高。估计题目设计的有问题。
【在 anylinkin 的大作中提到: 】
: 来源：huggingface vectara
: 为什么越后面的模型，幻觉率越高？ R1甚至还出现了一个断崖式的降低？
: 其他的大模型，基本上都是越新的模型，幻觉率越低。
: ...................
--
FROM 202.47.106.*
3楼|tgfbeta|2025-02-24 15:19:25|只看此ID
好像R1蒸馏版比原版的指令跟随要更差？
【在 Xjt 的大作中提到: 】
: 我仔细看了下，对这个测试的准确性存疑
: OpenAI的o1是准备的幻觉多，而且我自己用的时候也感觉幻觉很多。但是居然得分很高。估计题目设计的有问题。
--
FROM 111.162.221.*
4楼|Engelberger|2025-02-25 10:23:08|只看此ID
Ds r1训练的时候，和人对齐的偏少了
【在 Xjt 的大作中提到: 】
: 估计DS对幻觉没做很好的RL优化呗。我觉得这思路是非常正确的。幻觉应该用RAG解决而不是强行压制幻觉。等于压制了儿童的创造力
--
FROM 39.144.137.*
5楼|huaxinjuedui|2025-02-25 10:23:33|只看此ID
所以你会发现，让R1去写一些创造性的内容，会领先其他一大截。。

【在 Xjt 的大作中提到: 】
: 估计DS对幻觉没做很好的RL优化呗。我觉得这思路是非常正确的。幻觉应该用RAG解决而不是强行压制幻觉。等于压制了儿童的创造力
--
FROM 125.84.68.*
6楼|mv008|2025-02-27 09:10:13|只看此ID
请问V3和R1有什么区别呢
【在 huaxinjuedui 的大作中提到: 】
: 所以你会发现，让R1去写一些创造性的内容，会领先其他一大截。。
:
--
FROM 223.104.78.*
7楼|huaxinjuedui|2025-02-27 09:25:55|只看此ID
V3：根据训练内容，直接出答案，可以看成是集成版的搜索引擎，所以翻车的概率小（更多是总结或借鉴现有内容），响应的，回答的内容也是中规中矩的。。

R1：发散性思维，它会根据你的输入想得更多，所以出来的内容可能更不可控。

以作文举例：
V3就像一个好好读书的三好学生，每次60分作文，总能拿到50分。
R1就像一个文科怪才，每次写出的文章都让人赞叹，但是可能一不小心就偏题了，阅卷老师也只能忍痛给个低分，毕竟符合题意才是第一位的。。

【在 mv008 的大作中提到: 】
: 请问V3和R1有什么区别呢
--
FROM 113.205.176.*
8楼|mv008|2025-02-27 09:54:49|只看此ID
太形象了！牛！感谢！
【在 huaxinjuedui 的大作中提到: 】
: V3：根据训练内容，直接出答案，可以看成是集成版的搜索引擎，所以翻车的概率小（更多是总结或借鉴现有内容），响应的，回答的内容也是中规中矩的。。
: R1：发散性思维，它会根据你的输入想得更多，所以出来的内容可能更不可控。
: 以作文举例：
: ...................
--
FROM 223.104.78.*
9楼|djkstra|2025-02-27 13:39:03|只看此ID
把注意力设定的比较集中，注意力之外的知识就容易产生幻觉

【在 anylinkin 的大作中提到: 】
: 来源：huggingface vectara
: 为什么越后面的模型，幻觉率越高？ R1甚至还出现了一个断崖式的降低？
: 其他的大模型，基本上都是越新的模型，幻觉率越低。
: ...................
--
FROM 14.127.19.*