职位描述
1、负责100+B参数模型,1M序列长度的大规模分布式训练(DDP/F SDP/TP/SP/PP)和推理支持(RPC框架/VLLM/TRT);
2、与算法部门深度合作,进行算法与系统的联合优化;
3、负责机器学习效率优化,包括但不限于: 量化、剪纸、压缩、蒸馏、特征选择、NAS、编译优化;
4、负责特殊机器学习范式的支持,例如强化学习、联邦学习、图学习、优化器等。
职位要求
1、熟练掌握Linux环境下的C/C++编程;
2、对深度学习模型推理及训练有过实际上手经验,熟悉至少一种机器学习框架;
3、具有独立解决问题的能力,良好的团队合作精神,具备优秀的复杂问题拆解能力;
4、有强烈的工作责任心、较好的学习能力、沟通能力和自驱力;
5、了解某种主流机器学习框架的底层框架实现、具备GPU性能分析的经验、或有大规模分布式系统架构设计经验优先。
联系方式:quicksort2025@gmail.com
长期内推字节海量岗位,欢迎投递简历,帮你筛选适合的岗位。
--
FROM 124.90.41.*