你可以去听那种塔台和飞行员交互的语音通话,大部分情况你不看字幕根本听不清,特别是战斗机,那个SNR真叫一个感人。
不管命令词多少,信噪比摆在这里。抗噪声语音识别是一个很大的难题,文献上会提到丑帝上世纪80年尝试过在F16上用这种技术,根本没法实用化。
我曾经专门研究过这个领域的,不要以为命令词识别就容易,命令词识别没有上下文关联,挑战很大的,不说别的,一旦指令中有数字,比如“下降到高度xxx”,你想像一下一旦有误的后果。
还有战斗机场景下,识别率再高,也不希望有错误,因为一旦识别错误问题非常严重。这种场景根本不适合。
目前在民航上用语音识别作为通信用于规范化操作的一种监督机制,相当于“记录”通话过程,已经在应用了。但是根本不敢直接用它控制飞行有关设备。
现在即时在汽车场景,也只敢控制驾驶无关的设备,比如车窗、空调、娱乐系统等。根本不敢控制比如加速减速、拐弯等驾驶有关的。
【 在 stockfan 的大作中提到: 】
: 也不能这么说。战斗机上用的语音识别,是只识别少量命令,识别范围非常小,从而识别率高。办公室用的是听写模式,不限制范围,识别率低。
: 以前的语音识别有两种模式,命令模式和听写模式。我们在塔台模拟器上用的是命令模式,经过优化后识别率达到97%以上,那是20年前的事了。
--
FROM 14.153.152.*