水木社区手机版
首页
|版面-人工智能(AI)|
新版wap站已上线
返回
1/1
|
转到
主题:DS V2.5 V3 R1的幻觉率分别是2.4% 3.9% 14.3% 为何越新的模型幻
6楼
|
tgfbeta
|
2025-02-24 15:19:25
|
展开
好像R1蒸馏版比原版的指令跟随要更差?
【 在 Xjt 的大作中提到: 】
: 我仔细看了下,对这个测试的准确性存疑
: OpenAI的o1是准备的幻觉多,而且我自己用的时候也感觉幻觉很多。但是居然得分很高。估计题目设计的有问题。
--
FROM 111.162.221.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版