## 部门介绍
滴滴智能客服业务,包含IM客服、热线客服、实时语音、多模态对话,涉及意图识别、多轮会话、智能辅助、智能托管等
## 实习说明
- 计算机/AI/大数据相关专业本科或硕士在读
- 至少可实习 3 个月、每周至少 3 天
- 参与滴滴智能客服大模型升级改造,PE(提示工程)、RAG(检索增强生成)、大模型训练(cpt/sft/rl)、Agent设计
- 团队氛围轻松,每周例行技术分享,跟踪大模型最新热点,还可以发论文
## 岗位职责
(1)大模型数据工程师
工作内容:
- 深入参与构建大模型 Agent 高质量数据合成飞轮
- 构建用户模拟器与多维度评估体系链路闭环,让模型在对话中长本事、提质量。
具体工作:
- 基于业务场景设计并利用 LLM 构建多轮对话数据,建设高质量数据合成pipeline以及线上自进化数据飞轮。
- 基于业务场景抽象用户画像,设计可插拔的画像策略,实现支持多轮对话策略的自动交互,兼顾可控性与多样性。
- 设计构建评估模型与指标,构建自动化评估系统,实时监控数据质量与模型效果。
任职要求:
- 熟练Linux 常用命令、Python 、PyTorch、SQL
- 熟悉 NLP 基础任务,了解大模型基本原理。
- LLM 驱动的数据合成、角色模拟。
- 探索前沿技术,如:Auto Agent、GUI Agent
- 对数据工程、对话系统评估、强化学习任一方向有浓厚兴趣。
加分项:
- 参与过数据工程流水线、对话系统项目;
- 对 prompt engineering、RLHF、LLM 评估指标有实践经验;
- 有开源贡献或技术博客,乐于分享。
(2)大模型训练工程师
工作内容:
- 深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。
具体内容:
1. 支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。
2. 协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。
3. 驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。
任职要求:
- 计算机/AI相关专业本科或硕士在读,至少可实习 3 个月、每周至少3 天。
- 熟练Linux 系统常用命令、Python 、PyTorch、SQL
- 熟悉 NLP 基本任务、深度学习、强化学习
- 熟悉大模型基本原理,有大模型训练经验。
- 对 RLHF、奖励模型等有浓厚兴趣,自主钻研。
加分项:
- 7b以上LLM训练经验
- 熟悉典型训练框架,如:LLaMA-Factory、Unsloth、VeRL、Deepspeed、Megatron-LM等
- NLP顶会论文优先,密切跟进Post-Training方向最新论文
- 对语言模型、大模型、AGI、人机交互等兴趣浓厚
(3)Agent开发工程师
工作内容:
- 智能客服场景的Agent设计、开发,提升机器人服务质量、效率。
具体内容:
1.针对单轮、多轮任务设计合适的Agent架构(如ReACT/Reflexion/Multi-Agent)
2.根据反馈数据,优化Agent设计模式,持续进化。
3.基于Bad Case训练模型,提升Agent的理解、思考、决策、工具调用能力
任职要求:
- 计算机/AI相关专业本科或硕士在读
- 至少可实习 4个月、每周至少3 天。
- 熟练Linux 系统常用命令,Python 、PyTorch、SQL
- 具备机器学习、深度学习、强化学习基础
- 熟悉至少一种Agent开发框架/系统,如:Langchain、LangGraph、AutoGen,Dify、扣子。
加分项:
- 熟悉知名Agent产品,如:Manus、Genspark、Coze Space等
- 熟悉典型训练框架,如:LLaMA-Factory、Unsloth、VeRL、Deepspeed、Megatron-LM等
- NLP顶会论文优先,密切跟进国际知名公司(OpenAI/Claude/Google/META等)Agent产品
- 对语言模型、大模型、AGI、人机交互等兴趣浓厚
## 简历投递
发送简历时,注明“岗位+学校+姓名+年级”,预计实习期的起止时间,投递至 warrenwang@didiglobal.com
--
FROM 1.202.165.*