这个技术意义在于:
1)对于没有高清版本的作品,用技术“脑补”出更多细节,听起来会更舒服;
2)语音合成时可以添加一些细节,如随机的齿音,气流声,喘气等,显得更真实?
3)实时语音时给低码率的语音加上丰富的细节?
恢复大多数人本来就听不到的内容,似乎没有意义。
【 在 Miras () 的大作中提到: 】
: 现在腾讯已经做出来了ai语音带宽扩展,我所在的隔壁组也做出来了
: 音频文件wav压缩为mp3,主要减去的是人的心理听觉隐蔽效应去掉了一些人耳听不到的高频信息,其他的都是一些香农信息论减去的冗余信号肯定可以恢复出来
: 现在神经网络用于音乐恢复为无损,或者恢复高频部分,也就是把神经网络作为一个滤波器恢复出(脑补出)高频部分。效果还是不错的。用足够大的训练库是可以恢复出来的。(另外,绝大多数人,听不出来恢复后的和恢复前的音乐这就是另外一回事了)
--
FROM 221.219.115.*