急招强化学习专家,base北京,职级open
职位描述
1、主导大模型强化学习方向的前沿研究,支持各应用方向的基础能力提升,包括但不限于语言、视觉、听觉、传感器信号等多种模态的理解和生成,智能体及多智能体系统;
2、负责构建大规模强化学习训练框架,优化分布式训练效率与资源调度能力;设计并训练奖励模型;开发和改进强化学习数据采集、清洗和难度分级流程和工具;
3、结合业务场景,推动强化学习技术提升系统的端到端用户体验;
4、跟踪国际学术会议成果与工业界动态,指导创新论文方向,并参与人才培养和战略规划;
职位要求
1、本科及以上学历,计算机、人工智能及机器学习等相关专业;
2、3年以上强化学习项目经验,主导过至少1个完整的工业级大规模强化学习项目(如推荐系统优化、自动驾驶决策、智能体交互等),具备从算法设计到工程落地的全流程能力;
3、在人工智能领域国际学术顶会发表论文或参与知名开源项目者优先;
4、具备优秀的逻辑分析与问题解决能力,能够快速定位并优化复杂系统瓶颈;
5、协作意识强,能高效沟通并推动跨团队合作。
我们提供:
1. 具有竞争力的薪资待遇与丰富的福利。
2. 与顶尖AI团队合作的机会,参与大模型应用开发与优化。
3. 灵活的工作环境与技术创新的空间。
4. 完善的职业发展和培训机会,助力技能提升和成长。
投递邮箱:sundawei3@xiaomi.com
投递格式:水木社区+姓名+应聘岗位
可添加微信咨询职位详情:1035892905
--
FROM 1.202.162.*