数据工程 实习生
一、岗位职责
?数据工程构建?
负责大模型预训练数据质量提升,通过分类/聚类/多样性评估等方法清洗高质量数据?
构建Prompt数据池,研究批量生成技术以优化模型效果?
跟踪数据处理技术前沿,实施新工具提升工程效率?
?数据架构与治理?
设计数据仓库模型,维护数据完整性,支持Hive/Spark等大数据处理?
参与分布式数据库(如Kylin)性能优化,提升数据服务稳定性?
跨领域协作?
对接算法团队,提供高质量数据支撑大模型训练(如NLP任务的数据标注与评估)?
推动数据资产在业务场景(如智能问答、数据分析)落地?
二、任职要求
?技术能力?
精通Python/Java,熟练使用SQL及ETL工具(如Kettle)?
熟悉主流深度学习框架(PyTorch/TensorFlow)及数据处理库(Pandas/Numpy)?
具备分布式计算(Spark/Flink)或GPU加速(CUDA)经验者优先?
学历与经验?
本科及以上学历,计算机/数据工程等相关专业,1-3年大数据或AI项目经验?
有NLP数据处理、Transformer模型应用经验为加分项?
?软性素质?
强大的问题解决能力与跨团队沟通能力?
持续关注大模型领域技术动态(如RAG、Agent框架)?
实习时间:能够保证连续实习 [3] 个月以上,每周出勤不少于 [4] 天。
(二)加分项
项目经验:有 AI 产品的实习或项目经验,能够清晰阐述在项目中的角色与贡献。
技术能力:掌握 Python 基础编程,能够进行简单的数据处理与分析。了解 Prompt Engineering,有优化提示词提升模型输出效果的经验。
文档撰写:具备良好的技术文档撰写能力,能够清晰准确地描述技术方案、操作指南等。
三、福利待遇
实习补贴:提供具有竞争力的实习补贴
导师带教:每位实习生将配备一位资深导师,提供一对一的指导,助力职业成长。
学习资源:可免费参加公司内部的 AI 技术培训、产品管理课程等,接触行业前沿知识。
转正机会:实习表现优秀者,将有机会获得转正 offer,正式加入公司团队。
四、申请方式
请将个人简历发送至 [zhaolizn019@istarshine.com ],邮件主题请注明 “数据工程 实习生 - 姓名 - 学校 - 专业 - 可实习时长”。我们将在收到简历后的 [1] 个工作日内与合适的候选人联系。
--
FROM 123.127.7.*