几十年前就可以跟机器聊天了
那能一样吗
【 在 gtgtjing (非必要不正经) 的大作中提到: 】
: 各种聊天工具几年前就可以语音输入转成文字了
: 【 在 forevers 的大作中提到: 】
: : 多模态的大模型,简单点说就是把其他模态例如语音,图像,视频啥的也转化为类似文本一样的字符序列,这样也可以用本来处理文本的大模型技术来处理这些其他模态的数据,多个模态的数据可以捆绑在一起训练。相关论文之前就有了,中国高校的学者也有贡献,还听过他的现场报告,
: : 暇寡?踅缱苁窍扔诠ひ到纭?penAI能把这些技术落地,国内的大模型企业也能落地。
--
FROM 61.149.221.*