您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
岗位职责
1. 深度参与公司大规模预训练模型研发,包括架构设计、训练、微调和推理等环节的系统性研究;
2. 负责大模型训练、微调、推理框架的优化;
3. 负责面向公司产品的人工智能算法研发,包括但不限于语义理解、自动摘要和可控文本生成;
4. 跟踪学术界和工业界前沿技术,推动相关算法在公司项目中实际落地。
任职要求
1. 熟练掌握NLP和ML基础理论和算法,有NLP相关科研经历,熟练掌握Transformer系列模型架构和原理;
2. 熟练使用Python语言进行编程开发,熟练使用PyTorch、TensorFlow、JAX等至少一种深度学习框架;
3. 熟练使用Megatron-LM、DeepSpeed、Colossal-AI等至少一种模型训练框架,掌握模型并行、流水线并行、数据并行和ZeRO等并行训练技术;
4. 熟悉大模型推理优化技术,包括但不限于layer fusion、kernel fusion和量化等技术;
5. 敢于挑战,追求卓越,有创新精神和研发热情。
加分项
1. 有大规模预训练模型研发经验者优先;
2. 在ACL、EMNLP、NeurIPS、ICLR和NAACL等相关会议作为一作发表过论文者优先。
所发职位不全,手上职位非常多,欢迎咨询!
电话:18519274080
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.190.149.*