您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职责描述:
1. 优化大模型分布式训练速度;
2. 完善分布式训练框架,增加框架稳定性和扩展性
任职要求:
1. 学士及以上学历,计算机、电子、自动化等相关专业;
2. 熟悉Python,熟悉C/C++编程,编程能力优秀;
3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架;
4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用;
5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术;
6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理;
7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等;
8. 有相关的项目背景优先。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*