主要金贵在数据。目前语音识别有很多开源库。但是你没有那么多数据去训练模型。所以效果很难提升。
【 在 zhanghaoX 的大作中提到: 】
:
:
: 通过语音识别实时输出文本的功能,讯飞的软件还是按时间计费,还限制导出文本。
: 别的公司的产品在水平上还那么不堪吗?
: 想着本世纪初,当时输入法不好用,懒得敲字,就用IBM的vocicexxx撸毕设论文来着。
:
: 想要一个这样的功能,通过语音识别实时输出文本,最后能导出文本。
: 或者进一步的,直接读取音视频文件,可以很快的生成一个文本出来。讯飞有这样的产品吗?
:
: 想着很简单:用开源库的话,不需要比得上讯飞,稍微差点也可以,自己撸一个出来可以堪用?
:
: --
:
发自「今日水木 on PRO 5」
--
FROM 114.253.100.*