岗位职责方向一:高性能分布式GPU训练技术
1.样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;
2.计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;
3.高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等。
方向二:模型轻量化技术
1.模型压缩:结合量化、剪枝、蒸馏等手段对模型进行压缩,在保持精度下降可控的同时,大幅提升推理性能
2.高效模型结构设计:使用NAS、Architecture&Hardware Co-design等技术,设计运行高效的模型结构。
任职要求1.具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C++或Python;
2.学习能力强,对机器学习系统优化有技术热情,富有极客精神;
3.熟悉常见机器学习、深度学习算法,熟悉TensorFlow/PyTorch等深度框架代码的优先;
4.熟悉GPU、NPU硬件架构,熟练使用CUDA,NCCL,RDMA编程的优先;
5.有分布式系统、高性能计算实际项目经验的优先;
6.有开源项目贡献代码者优先。
岗位亮点1.支撑美团到家核心业务的搜索推荐环节,受关注度高;
2.当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快。
工作城市北京市
感兴趣的学弟学妹们抓紧机会啦!
联系方式:18610815764(wx同号)或者直接查看附件扫码进行投递!
※ 修改:·pkumc 于 Dec 4 16:56:03 2024 修改本文·[FROM: 103.37.140.*]
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 103.37.140.*]
修改:pkumc FROM 103.37.140.*
FROM 103.37.140.*