- 主题:大家说法Y是故意折腾人还是真为民着想
你需要“多说话人语音分离”模型
这是个常见功能
阿里的FunASR和 讯飞星火V4.0都可以搞定
FunASR是个开源项目可以免费,自己部署
需要自己有个带NVIDIA显卡的电脑,电脑新一点,内存大一点
差一点的电脑也能用CPU或AMD显卡、核显跑,最好32G内存以上,慢不少
建议搜FunASR的教程
--------------
想找完全免费的资源很难,因为音频转文字需要大量算力
大厂里最慷慨的就是google,也不能很好满足你这个十几小时的免费识别需求。
花点钱吧,不管是充值会员还是买电脑
--
修改:LYMing1986 FROM 124.126.186.*
FROM 124.126.186.*
节约点,一小时2块钱的也可以
2块就够买4090服务器呢
理论上,腾讯的cloudstudio和google的colab也可以,就是没折腾过前者
【 在 huang10zhi 的大作中提到: 】
: 搞个云服务器部署一下 一小时大概5块钱
--
FROM 124.126.186.*
人工改啊
【 在 iambigcat 的大作中提到: 】
: 总共十几个小时,实际是多个小文件,不太大。
: 我用了讯飞转化,里面可能是口音和噪音的原因,导致有些文字有错,这个我是应该人工改了提交给法院,还是照机器转化的原样的提交?
: 人工改的话,可能造成人为主观修改的嫌疑。
--
FROM 124.126.186.*