创始人清华大学背景,具备公司上市成功经验,技术理想主义者。
核心团队由百度、华为、微软、字节、腾讯等知名大厂以及海外技术精英,业界技术大牛,科学家。
目前估值12亿美金以上,商业化落地产品2B 2C。
微信&电话:15210750729
邮箱:jxiao@hiringby.com
地点:北京/上海
大模型算法专家
岗位职责
1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰AGI。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
分布式训练工程师
职位职责:
1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
2. 优化模型结构,提高模型的精度和泛化能力。
3. 调优训练数据,提高模型训练效果。
4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
职位要求:
1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow)。
3. 熟悉常用的模型结构和优化方法,例如 CNN、RNN、BERT、GPT等。
4. 熟悉数据调优和数据增强等相关技术。
5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。
大模型推理工程师 岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。
4. 熟悉LLM相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
对齐算法工程师
1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning、多轮对话等能力;
2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;
职位要求
1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验;
2.熟练使用pytorch/tensorflow深度学习框架,熟练掌握Transformer框架;
3.对 LLM 有深入理解和实践,有SFT、RLHF相关经验者优先;
4.较强的工程实现能力,熟练掌握C/C++, JAVA,Python等至少一种语言;
--
FROM 110.229.2.*