Amphion:一个开源的音频、音乐和语音生成项目。由香港中文大学(深圳)联合 OpenMMLab 联合推出的。硅谷大佬也给这个项目带货,打了 A+++级:
https://www.bilibili.com/video/BV18w411V7iq/机器之心报道:
https://mp.weixin.qq.com/s/2oR7tu-ltnXnZqNCi-unlA支持如下功能:
文本转语音( TTS ):高性能,支持主流模型及架构,可生成自然的声音。
歌声转换( SVC ):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。
文本转音频( TTA ):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM 。
其他音频生成任务待添加
GitHub:github.com/open-mmlab/Amphion
现招募语音、音频与音乐算法实习生:
岗位职责:
1.负责开源项目Amphion的开发和维护,开发新的算法框架,实现 SOTA 算法,提升用户体验和项目影响力;
2.追踪与研究业界前沿算法,包括但不限于音乐生成、音效生成、语音合成、语音增强、自监督学习、音频大模型等;
3.围绕Amphion打造系统工具链和平台,加速算法从研究向生产的转化,支持Amphion落地到各个研究机构和企业;维护和开发自动化流程。
职位要求:
1.对音频处理、语音处理、音乐生成、生成模型等其中一个方向有深入的了解;
2.对开源项目有热情,熟练掌握 Python 和 PyTorch,有良好的工程实现能力;
3.参与过知名开源项目贡献可加分,在技术社区有影响力可加分;
4.参与过大规模系统的设计、开发和维护者优先;
5.发表过一作高水平论文者可加分。
发送简历至邮箱:daisyluo@cuhk.edu.cn
邮件及简历命名格式:Amphion - 姓名 - 实习。
--
FROM 175.45.38.*