刚看到一篇新paper,
https://arxiv.org/pdf/2306.09896.pdf
这篇paper的做法是让gpt自省,也即自己给自己生成的程序进行分析反馈指导,然后看在给定token预算的情况下这样迭代下去的提升。
然后结论很有意思,chatgpt3.5自省,没有任何显著的变化。gpt4自省,则能表现出显著的进步。gpt4给chatgpt3.5进行反馈指导,也一样能让chatgpt3.5出现显著的提升。最后是人类加入进来给gpt4进行反馈指导,综合提升是gpt4自省的1.57倍。而且在3个难度级别上(科普级,面试级,竞赛级),人类反馈的提升也是难度越高效果越明显。
所以感觉上人类暂时还是可以松一口气的。但gpt4也在所有的难度级别上都展露了可以自省进步的苗头...以我当年研究alphago的经验,只要能有一点点的监督信号,ai其实就可以飞奔起来了...所以也许质变就在下一个大版本...
【 在 philbloo 的大作中提到: 】
: 你的经验总结一下:提问比回答重要。
:
: 假设机器不仅知道所有的现存知识,而且仅知道其中正确的知识,而且不会编造事实。(不用追究什么是正确,什么是事实,因为我也没法定义)那么如果只插电,人不介入,机器能不能对自己提出没有已知答案的问题,并且做出推演呢?
: ...................
--
修改:lvsoft FROM 49.93.82.*
FROM 49.93.82.*