一、其表现特征为:
1、胡说八道的比例多了起来,即所谓幻觉,增加了用户判断的精力和时间,降低了效率
不要说国内的AI(刷都因一堆相关段子),国外的AI也同样,包括Gemini, ChatGPT,更不要说claude和Copilot
譬如,昨天我随口问了句某芯片丝印标号的含义,结果这4个国外的AI给出完全不同的4个解释,而且全部都是错误的。但是他们说出来时,看起来就像正确的一样。若非因为我多问了下几个AI遇到完全不一致,否则我还真可能就信了第一个问的了。
譬如,我问一个基本的元件的可替换常识(电容坍塌方向),结果4个AI给出了2种截然对立的回答,无聊之下直接把Gemini的回答复制给chatGPT,结果两个直接炒了起来,彼此都认为对方是错误的。
2、回答里扯淡含量明显升高,不会针对性回答用户问题
以前问个问题,Gemini和chatGPT通常都是很简明针对性回答,阅读获取想要的答案也很快。如果我对问题有疑惑希望知悉细节,在我追问后,他们也会针对性的给出我希望的解释。
可现在这俩货,每次回答都明显越来越长,尤其是chatGPT,哪怕是个很简单的问题,通常也在3-4页以上的的回答,我要读一堆无关的信息或者本身都知道的信息。
如果问题得到解决,低效一点也就是忍了,可问题是,他们经常给出明显错误、或者看了半天后,结果并非给出了解决的答案而是一大堆扯淡的无价值信息,耽搁了自己几十分钟的时间,这个时候,通常会感觉到很不爽。
二、推测原因
1、可能因为各种原因,模型在普遍性地产生幻觉和降智
2、不知道回答“我不知道”,只会试图协助用户解决问题。
有点像现实里的一些老学究或者老技术人员,面对别人的请教,其实自己也可能不知道答案,但是“一定要帮助”的心态作祟,开始扯各种试探性的思路,或者泛泛经验性的思考这个问题的原则(但很多实际是无直接价值的),反而浪费了别人很多时间。
3、或者,模型的进化速度,赶不上用户不断增长的期望?
三、无法更改
提示词要求它,不知道的不要胡说,尤其是对于非推理性的问题,直接说不知道
但是它也就是当场会改一下,几个来回或换个话题,依然老样子
--
修改:anylinkin FROM 39.144.79.*
FROM 39.144.79.*