我的意思,这个流式响应,跟不用流式响应,都是一次性拿到了整个回答结果,所以流式响应根本不是想象中的那么回事。我还以为是 如下流程:
服务器a给客户端b发了一个字:中
b显示完,又给a发消息:显示完了;
a收到消息,才给b发下一个字:华
如此继续下去,直到发送完毕。
这个流式响应,和等待时间长不长,没有直接关系。(因为用不用这个,服务器端都是一次性产生了完整答案的)
【 在 PaoloMaldini 的大作中提到: 】
: API做成啥样子都行,但底层是另一码事吧
: 另外如果一次性等待可能时间太长,用户体验也不好
:
--
FROM 120.242.253.*