近年来,以大模型为核心的生成式人工智能技术在语言理解、内容生成、多模态建模与跨模态交互等领域取得了突破性进展,展现出前所未有的技术潜力与广泛的应用前景。语音是人人交流和人机交互中最自然、最便捷的模态,对语音AI的研究和应用已经成为人工智能领域的重要组成部分。在阿里巴巴,有关技术在流媒体播放、直播互动、智能客服、会议访谈、教育教学等场景,以及作为人机交互界面在AIoT、机器人、数字人等场景有广泛应用。
我们致力于通用人工智能(AGI)方向的前沿探索与产业落地创新。如果你对生成式AI、通用人工智能(AGI/ASI)前沿探索、多模态建模与智能交互系统有浓厚兴趣,并渴望深入参与下一代多模态通用模型的研发与演进,欢迎加入我们,共同定义未来AI的能力边界,牵引千行百业在智能时代的深度变革。
职位1:语音多模态大模型算法工程师
工作职责
1. 负责语音生成/语音识别/语音合成/声纹/语种/情感等方向的算法研究和开发。
2. 负责语音信号处理的相关算法研究和开发,包括语音增强、回声消除、混响消除、自动增益控制、波达方向估计、波束形成等。
3. 负责口语语言理解/用户意图理解/对话模型/语音交互等算法研究和开发。
4. 语音统一多模态大模型:研究下一代多模态通用大模型技术范式,实现文本、语音、视觉模态的联合建模。
职位要求
1. 计算机科学或相关专业硕士及以上学历,具有扎实的计算机、机器学习等理论基础。
2. 熟练掌握至少一种编程语言,具备扎实的技术基础。
3. 熟悉深度学习、信号处理、语音识别、语音合成、口语语言处理、语音交互、人工智能等类似领域。
4. 有良好的自我学习能力及自驱力,对前沿领域有强探索欲和好奇心、善于独立思考并反思总结;具备良好的沟通能力和团队协作能力。
职位2:语音多模态研发工程师
职位要求
1. 计算机科学或相关专业硕士及以上学历,具有扎实的计算机、机器学习等理论基础。
2. 具备良好的编程能力和代码风格,有分布式系统、模型推理、AI Infra开发经验者优先。
3. 较强的分析和解决问题能力,并具备良好的沟通能力和团队合作精神,喜欢钻研并反思总结。
加分项:
1. 有互联网公司实习,分布式系统、模型工程、语音/多模态模型等相关研发工作或项目落地经验。
2. 在ACM等知名编程竞赛有获奖经历。
3. 有相关领域高水平论文或专利发表。
简历投递: tongyi-speech-jobs@list.alibaba-inc.com
同时有大量实习岗位,欢迎联系!
--
修改:McTyro FROM 59.82.59.*
FROM 59.82.59.*