是的后台架构的原因,ChatGPT是AT(autoregressive)的单词接龙模型,只能一个一个字的生成
如果要一次生成完整的句子,理论上得需要NAT的模型,但NAT效果普遍是不如AT的。只是NAT性能可能会更好而已。
至于后一个字如何和前一个字产生关联,你需要学习embedding, attention, transformer, encoding/decoding, decoder masking等一系列机器学习技术。。。 才能理解
【 在 feng321 的大作中提到: 】
: 有的chatGPT是一个字一个字的蹦出来,有的chatGPT不是一个一个的蹦出来。这个效果,是前台做的?还是后台做的?听说后台产生答案的时候,是一个字一个字产生的,这可能吗?肯定不是随机产生的吧?后一个字如何跟前一个字关联?谢谢
--
修改:Xjt FROM 101.228.85.*
FROM 101.228.85.*