语音识别,叫做ASR技术,本身就是一种AI技术。
市面上的确有大模型加持的ASR。
最大的特征是,会因为之后识别的词,再返回去修改之前已经识别出来的词。
【 在 TimeAndRiver 的大作中提到: 】
: 前面26.1中的翻译app,我就感觉其中的语音输入准确率非常高,怀疑是引入了大模型
: 但是苹果输入法中的语音输入识别率就差了很多,怀疑这一块还没有接入大模型
: 26.2我试了一下,语音输入识别率一下就提高了很多,感觉也接入了大模型,识别率非常高,比微信自带那个语音转文字高多了,输出质量高多了
: ...................
--
FROM 119.57.115.*