大佬，静音是如何定义的？有好的识别静音的库吗？

水木社区手机版

主题:大佬，静音是如何定义的？有好的识别静音的库吗？

楼主|feng321|2024-07-08 14:38:38|只看此ID

感觉一段音频，你把播放音量调大一点，就有有声音。如果调到很小（或者就是0），就没有声音了。那静音，是如何被定义的呢？谢谢
另外，有好的识别静音的库推荐吗？目前用

audio, sample_rate = torchaudio.load(mp3_loud_new,format="mp3")
        print("sample_rate=",sample_rate)
        # 创建VAD对象
        vad = Vad(sample_rate=sample_rate)
        # 使用VAD进行语音活动检测
        vad_waveform = vad(audio)
        # 打印原始音频和去除静音部分后的音频长度
        print(mp3_loud_new + "，原始音频长度：", audio.size(1))   ####mp3_loud_new           file.filename
        print(mp3_loud_new + "，去除静音部分后的音频长度：", vad_waveform.size(1))
duration = vad_waveform.size(1) / sample_rate
        print("vad_waveform的播放时长：", duration, "秒")

然后，判断，如果duration 大于1.1秒，就不算是静音。否则，就当静音处理。但是效果不好，感觉有的经验，duration还是会超过1.1，怎么办？
--
FROM 39.146.79.*

1楼|superlq|2024-07-08 14:53:51|只看此ID
可以用ffmpeg来监测音视频文件的音量信息

监测结果用py处理

什么算静音，肯定是你自己建一个模型，持续时间、音量大小来综合考虑。

播放音量你自己跳转的是功放。音频原始也是有音量大小的。

【在 feng321 的大作中提到: 】
: 感觉一段音频，你把播放音量调大一点，就有有声音。如果调到很小（或者就是0），就没有声音了。那静音，是如何被定义的呢？谢谢
: 另外，有好的识别静音的库推荐吗？目前用
: [code=py]
: ...................
--
FROM 183.220.1.*
2楼|easior|2024-07-09 13:48:07|只看此ID
开个题外话，Python 里哪个 ffmpeg 库好用？
【在 feng321 的大作中提到: 】
: 感觉一段音频，你把播放音量调大一点，就有有声音。如果调到很小（或者就是0），就没有声音了。那静音，是如何被定义的呢？谢谢
: 另外，有好的识别静音的库推荐吗？目前用
: [code=py]
: ...................
--
FROM 120.253.228.*