- 主题:GPT4o来了
各种聊天工具几年前就可以语音输入转成文字了
【 在 forevers 的大作中提到: 】
: 多模态的大模型,简单点说就是把其他模态例如语音,图像,视频啥的也转化为类似文本一样的字符序列,这样也可以用本来处理文本的大模型技术来处理这些其他模态的数据,多个模态的数据可以捆绑在一起训练。相关论文之前就有了,中国高校的学者也有贡献,还听过他的现场报告,
: 暇寡踅缱苁窍扔诠ひ到纭penAI能把这些技术落地,国内的大模型企业也能落地。
--
FROM 111.203.106.*
这些是常规的语音识别,不是现在的NLP大模型把语音数据加进来一起训练实现的多模态的语音识别。
【 在 gtgtjing 的大作中提到: 】
: 各种聊天工具几年前就可以语音输入转成文字了
--
FROM 222.247.199.*
几十年前就可以跟机器聊天了
那能一样吗
【 在 gtgtjing (非必要不正经) 的大作中提到: 】
: 各种聊天工具几年前就可以语音输入转成文字了
: 【 在 forevers 的大作中提到: 】
: : 多模态的大模型,简单点说就是把其他模态例如语音,图像,视频啥的也转化为类似文本一样的字符序列,这样也可以用本来处理文本的大模型技术来处理这些其他模态的数据,多个模态的数据可以捆绑在一起训练。相关论文之前就有了,中国高校的学者也有贡献,还听过他的现场报告,
: : 暇寡?踅缱苁窍扔诠ひ到纭?penAI能把这些技术落地,国内的大模型企业也能落地。
--
FROM 61.149.221.*
就是看不出有什么不一样啊,对我而言唯一的作用就是起草各种材料类文件
【 在 bdhjl 的大作中提到: 】
: 几十年前就可以跟机器聊天了
: 那能一样吗
: 告,
: ...................
--
FROM 111.203.106.*
请问哪里访问呐?
--
FROM 119.161.171.*
那你离这些事情比较遥远
或者不太能体会这些变化
从大哥大到功能机到智能机对你来说也是生活中自然发生的事情
【 在 gtgtjing (非必要不正经) 的大作中提到: 】
: 就是看不出有什么不一样啊,对我而言唯一的作用就是起草各种材料类文件
: 【 在 bdhjl 的大作中提到: 】
: : 几十年前就可以跟机器聊天了
: : 那能一样吗
--
FROM 103.216.43.*
人工智能工业界远远走在学术界前面,全世界都这样,国内大厂目前做的也很好。
【 在 mizhahu 的大作中提到: 】
: 颠覆现有行业
: 反观国内学阀,什么都没搞出来
--
FROM 124.205.122.*