创始人清华大学姚班,业内技术大牛,成功经验,精英化研发团队。
核心团队由百度、华为、微软、字节、腾讯等知名大厂以及海外技术精英,业界技术大牛,科学家。
目前估值20亿+美金以上,国内及出海商业化落地,产品2C为主。
地点:北京/上海/深圳
微信&电话:15210750729
邮箱:jxiao@hiringby.com
目前招聘岗位不限大模型算法/多模态/aigc/训练/推理/后端,产品及运营岗位等
基本要求:211以上学校 背景+互联网大厂或知名大模型创业公司经验+3-8年工作经验佳,顶会顶篇,竞赛获奖背景优先
多模态算法工程师
职位描述
1. 探索多模态预训练环节更高效的Data和Modeling方法,使得当算力提升时,我们依然可以延续Scaling Law。用尽世界上的所有多模态数据。探索并实现更多更好的数据发现、清洗和生成策略。
2. 深入参与设计科学的MLLM实验,构建对MLLM经济有效的训练数据recipe,探索数据配比、模型scaling相关的前沿技术,深入参与并了解如何训练好一个MLLM基座模型。
3. 构建能够支撑PB级别数据量的基础平台和工具。具备极佳的工程实现能力和数据处理能力。
职位要求
1. 本科及以上学历,计算机、人工智能、自动化、数学专业优先
2. 具备强大的工程能力,能迅速迁移过往的工程经验,深入理解系统底层原理并进行系统优化,能快速学习新知识。
3. 对大模型的底层原理有基本理解,并能跟踪语言模型和多模态领域的最新技术动向。
4. 扎实的编程基础,对数据结构、算法设计基础有深度了解,熟练掌握Python/C++等主流语言一种或多种,熟练应用pytorch、tensorflow、huggingface等深度学习框架和库
5. 有ACM/IOI/NOI/Top Coder等算法竞赛获奖经历优先
6. 深入理解CV、NLP等机器学习领域的知识,拥有MLLM预训练、后训练和对齐等丰富实操经验,或MLLM数据筛选和优化相关经验优先
7. 熟悉Spark, Ray等分布式计算框架优先
8. 在顶级学术会议上发表论文者优先,在机器学习、人工智能领域内获得过优异成绩者优先
全栈开发工程师-工程效率
职位描述
1. 设计和开发内部研发效率工具,以提高产研团队的工作效率。包括不限于研发效能工具、数据分析系统等
2. 深入理解 Kimi 产品研发和大模型算法迭代的全流程,开发工具或系统,以 定义、量化并优化迭代效率
3. 独立完成系统的规划、研发和维护工作
职位要求
1. 对提高效率有热情,有使用和开发此类工具的经验;对代码质量有高要求者优先
2. 本科及以上学历,计算机科学或相关专业(非计算机专业但编程能力突出者亦可)
3. 三年以上的全栈开发经验,有实际的 Web 应用开发项目经验,有开源项目的维护经历者优先
4. 熟悉 Python 和 Golang 语言,对于 MySQL、ES、Redis、Kafka 等有使用经验
5. 良好的逻辑思维能力和问题解决能力。良好的沟通能力和团队合作精神。对新技术有强烈的好奇心和快速学习的能力。
爬虫工程师
职位描述
1、负责爬虫需求分析,分布式网络爬虫系统的开发和优化
2、负责实时监控爬虫的运行状态和预警处理
3、负责海量数据的爬取、清洗、解析、入库
4、负责持续维护爬虫系统的正常运行
职位要求
1、细心、良好的沟通和合作能力
1、对于常见网站的反爬技术如js加密混淆等有分析应用;
2、年以上爬虫经验,精通python语言,熟悉正则表达式,熟悉html;
3、熟悉分布式系统;
4、熟悉Linux平台开发,并且熟悉多线程多进程编程、网络编程,熟悉HTTP、TCP/UDP协议;
5、熟悉mysql,redis,mongo等数据库的使用。
6、熟悉以下消息队列的一种、如kafka、pulsar、rocketmq
加分项
1、熟悉APP攻防逆向,包括但不限于:逆向分析、虚拟多开等
2、对scrapy,pyppeteer,appinum或者其他爬虫框架有研究了解;
3、对大规模存储了解
4、熟悉golang
AI数据专家
职位描述
1、深入理解AI大模型,对大模型数据以及AI内容创作的理想态有深刻认知;对数据质量和模型性能的影响敏感;
2、有用户视角,理解创意写作场景(比如作文,公文,营销文案)中用户的诉求,对结果质量和用户满足度敏感;
3、能准确理解产研需求,通过PE(提示词工程)等方法,持续产出符合理想态的高质量内容;
4、负责创意写作场景中大模型数据的标注、质检与策略运营工作;
5、与产研协同,针对大模型的突出问题,进行专项攻坚。
职位要求
1、本科及以上学历,汉语言文学、教育学等相关专业学科,985、211等高校毕业教师优先;
2、语文学科功底扎实,具备2年以上相关教学经验;具备教育部颁发的相应教师资格证书优先;有在作文,公文、营销方案写作中有丰富的经验者优先。
3、做过大模型产品、产品运营、AI训练师、数据标注等相关工作者优先;
4、对大模型行业有较好理解,深度体验或使用过 Kimi、文心、豆包、GPT4 等大模型产品者优先;
5、了解并掌握 PE 技能,有过调试大模型经验并产出过优质内容的加分;
高级算法系统工程师
跨模态通用模型的开发中,设计、构建高效的数据流转、训练、测试的系统,通过创新的工程+模型混合设计,极大加速研发过程。我们希望你对于深度学习有扎实理解,并且热衷于发掘研发过程中显现的模式,通过合理的抽象和良好的设计构建便捷、鲁棒、可复用的 library 和 service。
职位要求
1. 计算机科学或相关领域的硕士及以上学位;
2. 对机器学习/大模型的底层原理有扎实理解,具有大模型训练/计算机视觉/强化学习相关方向的工程经验;
3. 熟悉 Python/C++,有较强的架构能力和优秀的代码规范。拥有全栈开发能力,践行 devops 习惯,有代码洁癖者优先;
4. 优先考虑为有影响力的开源项目做出贡献的候选人,或在信息学竞赛、ACM等比赛中获得过名次者。
大规模数据处理工程师(模型训练数据)
职位描述
1.负责公司机器学习的大规模训练数据处理
职位要求
1. 在数据处理、清洗、标注,或推荐系统、搜索、广告排序等项目的等开发经验,并在项目中承担重要角色;
2. 熟练使用Python;
3. 熟练使用 Spark 或者 ray,使用过tensorflow或者pytorch的一种;
4. 熟悉分布式系统,能够设计大规模离线分布式系统,对大规模存储有经验;
5. 熟悉 NLP 或者 CV,有过实际训练 NLP 和 CV 模型并上线的经验;
6. 良好的思维能力、独立思考和解决问题的能力,良好的沟通能力。
加分项:Golang,Ray,Docker,K8S
大数据开发工程师(数仓)
职位描述
负责数仓的规划、落地和演进,使用系统化的方法、平台化的建设以满足快速增长的数据需要
负责数据基础架构和数据处理体系的探索、升级和优化,不断提升系统的稳定性和处理效率。
职位要求
精通 Python,Java 编程语言,会 Go,Rust,C++ 尤佳。
有过数仓系统化建设经验,熟悉数据建模,数据治理等理论
熟练使用多种大数据技术,如 Hadoop,Spark,Flink,Iceberg,Hbase,Doris,ClickHouse等,并对部分组件的设计原理有深刻的见解。
有过数据型平台设计经验,包括但不限于埋点平台,用户画像,AB测试,搜索引擎,数据中台,个性化推荐
具备数据思维,良好的沟通能力和问题解决能力
有开源贡献经验、PB 级数据处理经验、熟悉 K8S 者优先
训练框架开发工程师
- 本科及以上学历,计算机相关专业- 熟悉 PyTorch 等某一种机器学习框架
- 有 CUDA 编程、HPC、分布式计算经验者优先- 2-5年工作经验,代码能力好,ACM/NOI 等比赛获奖者优先
推理优化工程师
- 熟练掌握 Python、C++、- 熟练掌握 CUDA,或拥有3年以上的计算密集型优化经验、
- 同时拥有分布式系统设计经验者优先
多模态数据工程师
负责对超大规模的多模态数据进行打标、清洗和评估。构建能够支撑PB级别数据量的基础平台和工具。
探索并实现更多更好的数据发现、清洗和生成策略。
--
修改:hrjack FROM 110.229.1.*
FROM 110.229.1.*