岗位名称:语言大模型算法工程师
工作内容:
1. NLP大模型前沿探索,推动NLP大模型效果达到行业领先
2. 协同跨团队技术和业务同学共同达成技术和业务目标
任职要求:
1. 对NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解;
2. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
3. 有良好的代码开发能力和沟通能力;
4. 发表过大模型相关研究AI顶会论文优先;
麻烦投递简历到:liuwei40@xiaomi.com
--
FROM 1.202.162.57