- 主题:有没有好用的离线语音转文字工具?
RT,用来整理会议记录
--
FROM 124.16.189.*
前几天试了个叫buzz的,提供多种模型选择,但小模型准确率不行,大的模型太耗资源而且巨慢。机器好的可以试试。
【 在 MirsWings 的大作中提到: 】
: RT,用来整理会议记录
--
FROM 58.135.83.*
那个用的就是 whisper 的模型
我前段时间想玩玩百度的 paddleSpeech
结果试了试,发现百度做的破玩意里面坑巨多
各种版本和库的兼容问题,目前没时间精力折腾,暂时放弃了
何况这种东西就算折腾半天解决了,也只是掌握了一些奇技淫巧、毫无价值的垃圾知识而已
我这段时间一直在想,有没有哪位逆向破解方面的大牛
把Win系统自带的微软拼音输入法的语音识别接口搞明白,直接调用该接口用来语音识别效果就很好,我的使用体验至少比搜狗和讯飞的语音识别准确率更高,而且支持语音输入符号等
如果能搞定,这就是不需安装,免费并且识别效果好的完美方案,虽然不是离线的,但至少不需要购买AZure的语音服务
【 在 dyingsun 的大作中提到: 】
: 前几天试了个叫buzz的,提供多种模型选择,但小模型准确率不行,大的模型太耗资源而且巨慢。机器好的可以试试。
--
修改:pixYY FROM 111.36.201.*
FROM 111.36.201.*
好想法,等你分享经验
【 在 pixYY 的大作中提到: 】
: 那个用的就是 whisper 的模型
: 我前段时间想玩玩百度的 paddleSpeech
: 结果试了试,发现百度做的破玩意里面坑巨多
: ...................
--
FROM 124.16.189.*