就是输入一段参考语音,
然后输入一段文字,
生成用参考语音这个人的声音朗读的文字。
类似的软件还有SoVITS等。
生成语音的效果非常好,和参考语音那个人的音色非常像。
不过有些问题:
1、像ai画图一样,同一段参考语音和文字,每次运行的结果不相同。
2、有时有多读一个字或者少读一个字的情况。
3、一长段文字被自动切分为多段文字进行转换。每两小段之间的接合处处理的不好,有时连的太紧。
总之,这是一个不成熟的技术,就像ai画图一样,画的好的时候挺好,但有时就画的很差。和ai画图不一样的是,用的人少,所以目前针对这个的开发也少。界面比较简单,可设置项很少。例如,无法手动加入停顿等。
--
FROM 202.98.17.*