游戏AI算法 (强化学习)实习生（算法/框架）

水木社区手机版

展开|楼主|同主题展开|返回

主题:游戏AI算法 (强化学习)实习生（算法/框架）
tqwangdut|2020-08-17 15:05:52|
【团队简介】重点研究博弈对抗系统搭建与智能决策，为目前AI领域最前沿的方向。团队成员以国内外著名大学毕业和在读学生为主。
【职位简介】
-本实习岗位以深度强化学习技术为核心，以训练超越人类智能的游戏AI为目标。你将和团队成员参与国内某重要的人机对抗AI挑战赛，优化alphastar算法在特定复杂博弈环境中与全国选拔的顶级优秀指挥员对抗。
-在这里，你将有机会深入了解深度强化学习及大规模并行训练等技术，参与强化学习前沿算法与应用研究、多机多卡训练框架搭建，更将参与到需求分析、算法设计、代码开发测试、AI交付部署等流程中。
-你将收获1）先进的深度强化学习算法框架和平台经验；2）上百块V100的大规模分布式算法训练经验； 3）AI与顶级玩家对抗的挑战体验；4）并有机会分享10w+的比赛奖金。
-我们确信这次实习机会将为您提供良好的专业学习和挑战。

【任职要求】
-计算机、自动化、数学、统计、机器学习等相关专业。
-具备优秀的分析和解决问题的能力、主动积极、有责任心和团队意识。

算法方向
- 有扎实的算法功底，对常用的强化学习算法有较深刻的理解，有调参经验.
- 熟练至少一种深度学习框架，如tensorflow、pytorch.
- 编程能力强，代码习惯良好，具备较强的算法复现能力，有魔改经验.

框架方向（满足下述一条即可）
- 熟练掌握Ray/RLlib、acme、PARL等分布式强化学习框架中的一种.
- 熟练掌握NCCL、Gloo等分布式训练通信协议中的一种.
- 熟悉并使用过Hovorod、tf.distributed、torch.distributed等深度学习分布式框架中的一种，并对分布式SGD有较为清晰的认识.
- 熟练掌握grpc、RDMA、MPI等通信协议中的一种.

【待遇】
- 月薪5k+，根据个人综合能力确定.
- 为表现优秀者提供留所工作的机会.
工作地点：
中科院自动化所，北京市海淀区中关村东路95号，近10号线知春路/知春里地铁站.
联系方式:
邮箱地址：tianqi.wang@ia.ac.cn（投递简历时请注明信息来源）
邮件标题：游戏AI算法实习生_实习期_入职时间_姓名
--
FROM 159.226.181.*