【社招】明星大模型公司大模型/多模态/aigc/训练/推理/后端

水木社区手机版

展开|楼主|同主题展开|返回

主题:【社招】明星大模型公司大模型/多模态/aigc/训练/推理/后端
hrjack|2024-11-23 21:03:05|
创始人清华大学姚班，业内技术大牛，成功经验，精英化研发团队。
核心团队由百度、华为、微软、字节、腾讯等知名大厂以及海外技术精英，业界技术大牛，科学家。
目前估值20亿+美金以上，国内及出海商业化落地，产品2C为主。
地点：北京/上海/深圳

微信&电话：15210750729
邮箱：jxiao@hiringby.com

目前招聘岗位不限大模型算法/多模态/aigc/训练/推理/后端，产品及运营岗位等
基本要求：211以上学校背景+互联网大厂或知名大模型创业公司经验+3-8年工作经验佳，顶会顶篇，竞赛获奖背景优先

多模态算法工程师
职位描述
1. 探索多模态预训练环节更高效的Data和Modeling方法，使得当算力提升时，我们依然可以延续Scaling Law。用尽世界上的所有多模态数据。探索并实现更多更好的数据发现、清洗和生成策略。
2. 深入参与设计科学的MLLM实验，构建对MLLM经济有效的训练数据recipe，探索数据配比、模型scaling相关的前沿技术，深入参与并了解如何训练好一个MLLM基座模型。
3. 构建能够支撑PB级别数据量的基础平台和工具。具备极佳的工程实现能力和数据处理能力。
职位要求
1. 本科及以上学历，计算机、人工智能、自动化、数学专业优先
2. 具备强大的工程能力，能迅速迁移过往的工程经验，深入理解系统底层原理并进行系统优化，能快速学习新知识。
3. 对大模型的底层原理有基本理解，并能跟踪语言模型和多模态领域的最新技术动向。
4. 扎实的编程基础，对数据结构、算法设计基础有深度了解，熟练掌握Python/C++等主流语言一种或多种，熟练应用pytorch、tensorflow、huggingface等深度学习框架和库
5. 有ACM/IOI/NOI/Top Coder等算法竞赛获奖经历优先
6. 深入理解CV、NLP等机器学习领域的知识，拥有MLLM预训练、后训练和对齐等丰富实操经验，或MLLM数据筛选和优化相关经验优先
7. 熟悉Spark, Ray等分布式计算框架优先
8. 在顶级学术会议上发表论文者优先，在机器学习、人工智能领域内获得过优异成绩者优先

全栈开发工程师-工程效率
职位描述
1. 设计和开发内部研发效率工具，以提高产研团队的工作效率。包括不限于研发效能工具、数据分析系统等
2. 深入理解 Kimi 产品研发和大模型算法迭代的全流程，开发工具或系统，以定义、量化并优化迭代效率
3. 独立完成系统的规划、研发和维护工作
职位要求
1. 对提高效率有热情，有使用和开发此类工具的经验；对代码质量有高要求者优先
2. 本科及以上学历，计算机科学或相关专业（非计算机专业但编程能力突出者亦可）
3. 三年以上的全栈开发经验，有实际的 Web 应用开发项目经验，有开源项目的维护经历者优先
4. 熟悉 Python 和 Golang 语言，对于 MySQL、ES、Redis、Kafka 等有使用经验
5. 良好的逻辑思维能力和问题解决能力。良好的沟通能力和团队合作精神。对新技术有强烈的好奇心和快速学习的能力。

爬虫工程师
职位描述
1、负责爬虫需求分析，分布式网络爬虫系统的开发和优化
2、负责实时监控爬虫的运行状态和预警处理
3、负责海量数据的爬取、清洗、解析、入库
4、负责持续维护爬虫系统的正常运行
职位要求
1、细心、良好的沟通和合作能力
1、对于常见网站的反爬技术如js加密混淆等有分析应用；
2、年以上爬虫经验，精通python语言，熟悉正则表达式，熟悉html；
3、熟悉分布式系统；
4、熟悉Linux平台开发，并且熟悉多线程多进程编程、网络编程，熟悉HTTP、TCP/UDP协议；
5、熟悉mysql，redis，mongo等数据库的使用。
6、熟悉以下消息队列的一种、如kafka、pulsar、rocketmq
加分项
1、熟悉APP攻防逆向，包括但不限于：逆向分析、虚拟多开等
2、对scrapy,pyppeteer,appinum或者其他爬虫框架有研究了解；
3、对大规模存储了解
4、熟悉golang

AI数据专家
职位描述
1、深入理解AI大模型，对大模型数据以及AI内容创作的理想态有深刻认知；对数据质量和模型性能的影响敏感；
2、有用户视角，理解创意写作场景（比如作文，公文，营销文案）中用户的诉求，对结果质量和用户满足度敏感；
3、能准确理解产研需求，通过PE（提示词工程）等方法，持续产出符合理想态的高质量内容；
4、负责创意写作场景中大模型数据的标注、质检与策略运营工作；
5、与产研协同，针对大模型的突出问题，进行专项攻坚。
职位要求
1、本科及以上学历，汉语言文学、教育学等相关专业学科，985、211等高校毕业教师优先；
2、语文学科功底扎实，具备2年以上相关教学经验；具备教育部颁发的相应教师资格证书优先；有在作文，公文、营销方案写作中有丰富的经验者优先。
3、做过大模型产品、产品运营、AI训练师、数据标注等相关工作者优先；
4、对大模型行业有较好理解，深度体验或使用过 Kimi、文心、豆包、GPT4 等大模型产品者优先；
5、了解并掌握 PE 技能，有过调试大模型经验并产出过优质内容的加分；

高级算法系统工程师
跨模态通用模型的开发中，设计、构建高效的数据流转、训练、测试的系统，通过创新的工程+模型混合设计，极大加速研发过程。我们希望你对于深度学习有扎实理解，并且热衷于发掘研发过程中显现的模式，通过合理的抽象和良好的设计构建便捷、鲁棒、可复用的 library 和 service。
职位要求
1. 计算机科学或相关领域的硕士及以上学位；
2. 对机器学习/大模型的底层原理有扎实理解，具有大模型训练/计算机视觉/强化学习相关方向的工程经验；
3. 熟悉 Python/C++，有较强的架构能力和优秀的代码规范。拥有全栈开发能力，践行 devops 习惯，有代码洁癖者优先；
4. 优先考虑为有影响力的开源项目做出贡献的候选人，或在信息学竞赛、ACM等比赛中获得过名次者。

大规模数据处理工程师（模型训练数据）
职位描述
1.负责公司机器学习的大规模训练数据处理
职位要求
1. 在数据处理、清洗、标注，或推荐系统、搜索、广告排序等项目的等开发经验，并在项目中承担重要角色；
2. 熟练使用Python；
3. 熟练使用 Spark 或者 ray，使用过tensorflow或者pytorch的一种；
4. 熟悉分布式系统，能够设计大规模离线分布式系统，对大规模存储有经验；
5. 熟悉 NLP 或者 CV，有过实际训练 NLP 和 CV 模型并上线的经验；
6. 良好的思维能力、独立思考和解决问题的能力，良好的沟通能力。
加分项：Golang，Ray，Docker，K8S

大数据开发工程师（数仓）
职位描述
负责数仓的规划、落地和演进，使用系统化的方法、平台化的建设以满足快速增长的数据需要
负责数据基础架构和数据处理体系的探索、升级和优化，不断提升系统的稳定性和处理效率。
职位要求
精通 Python，Java 编程语言，会 Go，Rust，C++ 尤佳。
有过数仓系统化建设经验，熟悉数据建模，数据治理等理论
熟练使用多种大数据技术，如 Hadoop，Spark，Flink，Iceberg，Hbase，Doris，ClickHouse等，并对部分组件的设计原理有深刻的见解。
有过数据型平台设计经验，包括但不限于埋点平台，用户画像，AB测试，搜索引擎，数据中台，个性化推荐
具备数据思维，良好的沟通能力和问题解决能力
有开源贡献经验、PB 级数据处理经验、熟悉 K8S 者优先

训练框架开发工程师
- 本科及以上学历，计算机相关专业- 熟悉 PyTorch 等某一种机器学习框架
- 有 CUDA 编程、HPC、分布式计算经验者优先- 2-5年工作经验，代码能力好，ACM/NOI 等比赛获奖者优先

推理优化工程师
- 熟练掌握 Python、C++、- 熟练掌握 CUDA，或拥有3年以上的计算密集型优化经验、
- 同时拥有分布式系统设计经验者优先

多模态数据工程师
负责对超大规模的多模态数据进行打标、清洗和评估。构建能够支撑PB级别数据量的基础平台和工具。
探索并实现更多更好的数据发现、清洗和生成策略。
--
修改:hrjack FROM 110.229.1.*
FROM 110.229.1.*