请看附件。我用的
https://data.zhishuyun.com 提供的免费接口。至少从我python代码(知数云提供的样例代码)debug来看,问题的答案,还是后台一次性的吐给了前台。
r = requests.post(url, headers=headers, json=body, stream=True)
执行完这句后,前台就拿到了完整的答案。(但我不知道为何,他又要一个字一个字的划分)。拉到最下面后,完整的答案就出来了。
前台想一个字一个字的显示,完全可以拿到全部答案后,一个字一个字的显示。
欢迎探讨。
【 在 Xjt 的大作中提到: 】
: 是的后台架构的原因,ChatGPT是AT(autoregressive)的单词接龙模型,只能一个一个字的生成
: 如果要一次生成完整的句子,理论上得需要NAT的模型,但NAT效果普遍是不如AT的。只是NAT性能可能会更好而已。
: 至于后一个字如何和前一个字产生关联,你需要学习embedding, attention, transformer, encoding/decoding, decoder masking等一系列机器学习技术。。。 才能理解

--
FROM 120.242.253.*