我们正在寻找一位具备扎实技术背景和丰富实践经验的大模型数据工程师,专注于构建高质量训练与评测数据体系,推动大模型迭代优化。您将深度参与数据全生命周期管理,包括数据采集、清洗、标注、质量评估、评测框架设计及模型效果分析,为大模型研发提供核心驱动力。
核心职责:
1. 数据构建与优化:
设计并开发大模型预训练、微调(SFT)、强化学习(RLHF)等阶段的高质量数据集,涵盖文本、多模态等场景。
制定数据清洗、去噪、标注策略,设计数据增强方案,提升数据多样性和有效性。
整合多来源数据(开源/业务日志/用户反馈等),解决数据稀缺性和分布偏差问题。
2. 数据质量评估与治理:
建立数据质量评估体系,制定量化指标(如一致性、多样性、偏差度),分析数据缺陷并提出改进方案。
开发自动化工具(如规则引擎、模型辅助标注),提升数据处理效率与标准化水平。
3. 评测框架设计与模型评估:
构建大模型能力评测体系,开发自动化评估工具,设计多维度指标(准确性、鲁棒性、安全性等)。
针对模型输出进行人工/自动化评估,分析模型优缺点,撰写评估报告并提出调优建议。
跟踪学术界与工业界评测方案(如HELM、Open LLM Leaderboard),推动前沿方法落地。
4. 协作与赋能:
与算法工程师、产品经理紧密合作,理解业务需求,设计数据闭环方案。
沉淀数据与评测方法论,推动团队标准化流程建设。
任职要求:
1. 计算机科学、人工智能、统计学等相关领域硕士及以上学历,本科要求211,3年以上大数据/算法相关经验。
2. 精通Python,熟悉PyTorch/TensorFlow框架,熟练使用Pandas/Numpy等数据处理库。
3. 深入理解大模型技术(如Transformer、Prompt Engineering、RLHF),具备数据侧调优实战经验。
4. 熟悉主流数据工具链(Hugging Face Datasets、Spark、SQL),具备分布式数据处理能力。
经验要求:
1. 至少主导过1个完整的大模型数据项目(如构建千亿token级预训练数据或万级SFT数据)。
2. 具备评测框架开发经验,熟悉BLEU/ROUGE等传统指标及基于LLM的自动评估方法(如GPT-4评估)。
3. 对数据敏感,能通过统计分析、可视化工具(Tableau/Matplotlib)洞察数据问题。
加分项:
1. 在ACL/EMNLP等顶会发表数据相关论文,或贡献过开源数据集/工具。
2. 熟悉多模态数据处理(图像/音频/视频)或垂直领域数据(法律、医疗、代码)。
3. 具备全栈开发能力,可快速搭建数据标注平台或评测Demo。
工作地点:南二环,陶然亭公园附近。
感兴趣的小伙伴请发邮件到:370774321@qq.com 。
--
修改:cmsgoogle FROM 123.125.76.*
FROM 123.125.76.*