- 主题:DS V2.5 V3 R1的幻觉率分别是2.4% 3.9% 14.3% 为何越新的模型幻
V3:根据训练内容,直接出答案,可以看成是集成版的搜索引擎,所以翻车的概率小(更多是总结或借鉴现有内容),响应的,回答的内容也是中规中矩的。。
R1:发散性思维,它会根据你的输入想得更多,所以出来的内容可能更不可控。
以作文举例:
V3就像一个好好读书的三好学生,每次60分作文,总能拿到50分。
R1就像一个文科怪才,每次写出的文章都让人赞叹,但是可能一不小心就偏题了,阅卷老师也只能忍痛给个低分,毕竟符合题意才是第一位的。。
【 在 mv008 的大作中提到: 】
: 请问V3和R1有什么区别呢
--
FROM 113.205.176.*
太形象了!牛!感谢!
【 在 huaxinjuedui 的大作中提到: 】
: V3:根据训练内容,直接出答案,可以看成是集成版的搜索引擎,所以翻车的概率小(更多是总结或借鉴现有内容),响应的,回答的内容也是中规中矩的。。
: R1:发散性思维,它会根据你的输入想得更多,所以出来的内容可能更不可控。
: 以作文举例:
: ...................
--
FROM 223.104.78.*
把注意力设定的比较集中,注意力之外的知识就容易产生幻觉
【 在 anylinkin 的大作中提到: 】
: 来源:huggingface vectara
: 为什么越后面的模型,幻觉率越高? R1甚至还出现了一个断崖式的降低?
: 其他的大模型,基本上都是越新的模型,幻觉率越低。
: ...................
--
FROM 14.127.19.*