核心团队由百度、华为、微软、字节、腾讯等知名大厂组成,清华多位大佬鼎力支持,创始人具备从0到公司上市成功经验。
目前团队正在搭建中,核心岗位虚位以待。
微信&电话:15210750729
邮箱:jxiao@hiringby.com
地点:北京/上海
大模型算法专家
岗位职责
1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰AGI。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
训练框架专家
职位职责:
1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
2. 优化模型结构,提高模型的精度和泛化能力。
3. 调优训练数据,提高模型训练效果。
4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
职位要求:
1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow)。
3. 熟悉常用的模型结构和优化方法,例如 CNN、RNN、BERT、GPT等。
4. 熟悉数据调优和数据增强等相关技术。
5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。
大模型推理工程师 岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。
4. 熟悉LLM相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
强化学习算法专家
职位描述
1. 负责 RLHF 相关的强化学习迭代工作。
2. 设计和实现基于强化学习的算法模型,优化模型的性能和稳定性。
3. 持续跟进最新的强化学习算法研究进展,并将其应用到大模型系统中。
职位要求
1. 熟悉强化学习算法及其在自然语言处理和对话系统领域的应用。
2. 熟练掌握深度学习和强化学习相关的编程语言和工具(如 Python、TensorFlow、PyTorch 等)。
3. 具有较强的算法设计和实现能力,熟悉算法的优化和调试方法。
4. 具备较强的团队合作能力和沟通能力。
内容风控算法专家
职位描述
1. 参与大语言模型风控体系的设计、改进和研发工作,保障整个风控系统的快速,高效,全面;
2. 大语言模型风控体系的数据建设、安全reward model的建模优化、以及RLHF的效果调优;
3. 在法律、医疗等垂直场景持续深入优化风控效果;
4. 探索安全性与有用性之间的关系,找到更加有效的平衡点;
5. 紧跟LLM风控技术与强化学习的发展趋势,结合实际问题,快速验证业界最新方法。
职位要求
1. 本科及以上学历,计算机科学、软件工程或相关专业;
2. 具备扎实的编程基础,熟悉 Python、C++等编程语言;
3. 扎实的编码能力,熟练使用python/c++之一,熟悉linux开发环境,具有面向海量数据的机器学习/数据挖掘处理能力;
4. 具备优秀的分析解决问题能力,良好的沟通能力,自我驱动力,抗压能力以及团队合作精神;
5. 熟练掌握主流的NLP模型和算法,有实际的文本分类、实体识别、关键词挖掘、文本相似检索、意图识别等实际NLP项目经验; 体系构建; 5.具有较强的沟通能力,善于总结和分享算法技术。
--
FROM 101.18.50.*