识别只是第一步,离转化成能操作的指令还有一步。
比如说“导航到xxx”这种指令如何解决xxx地址里面同音字的问题只靠科大讯飞的模型是解决不了的,要和地图的地址数据库配合。
再比如连续语音控制要带上下文的理解,科大讯飞也提供这种能力,但是一种更普遍的语义理解,车机团队需要把模型训练到一个特定的语义集上。
事实上现在单纯语音识别这一点已经很完善了,后面这一步才是各家主机厂的差异所在。
【 在 googlestyle 的大作中提到: 】
: 语音能识别,指令应该不是问题
【 在 yzt356 的大作中提到: 】
: 并不完全是,讯飞只能给出语音识别和语法树生成...
--
FROM 222.129.38.*