Re: 大家说法Y是故意折腾人还是真为民着想

水木社区手机版

主题:Re: 大家说法Y是故意折腾人还是真为民着想
4楼|LYMing1986|2025-06-06 03:35:46|展开
你需要“多说话人语音分离”模型
这是个常见功能
阿里的FunASR和讯飞星火V4.0都可以搞定

FunASR是个开源项目可以免费，自己部署
需要自己有个带NVIDIA显卡的电脑，电脑新一点，内存大一点
差一点的电脑也能用CPU或AMD显卡、核显跑，最好32G内存以上，慢不少

建议搜FunASR的教程
--------------
想找完全免费的资源很难，因为音频转文字需要大量算力
大厂里最慷慨的就是google，也不能很好满足你这个十几小时的免费识别需求。

花点钱吧，不管是充值会员还是买电脑
--
修改:LYMing1986 FROM 124.126.186.*
FROM 124.126.186.*
10楼|LYMing1986|2025-06-06 09:25:10|展开
节约点，一小时2块钱的也可以
2块就够买4090服务器呢

理论上，腾讯的cloudstudio和google的colab也可以，就是没折腾过前者

【在 huang10zhi 的大作中提到: 】
: 搞个云服务器部署一下一小时大概5块钱
--
FROM 124.126.186.*
40楼|LYMing1986|2025-06-08 10:54:35|展开
人工改啊

【在 iambigcat 的大作中提到: 】
: 总共十几个小时，实际是多个小文件，不太大。
: 我用了讯飞转化，里面可能是口音和噪音的原因，导致有些文字有错，这个我是应该人工改了提交给法院，还是照机器转化的原样的提交？
: 人工改的话，可能造成人为主观修改的嫌疑。
--
FROM 124.126.186.*