创始人清华大学背景,具备公司上市成功经验,技术理想主义者。
核心团队由百度、华为、微软、字节、腾讯等知名大厂以及海外技术精英,业界技术大牛,科学家。
目前估值12亿美金以上,商业化落地产品2B 2C。
微信&电话:15210750729
邮箱:jxiao@hiringby.com
地点:北京/上海
大模型算法专家
岗位职责
1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰AGI。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
分布式训练工程师
职位职责:
1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
2. 优化模型结构,提高模型的精度和泛化能力。
3. 调优训练数据,提高模型训练效果。
4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
职位要求:
1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow)。
3. 熟悉常用的模型结构和优化方法,例如 CNN、RNN、BERT、GPT等。
4. 熟悉数据调优和数据增强等相关技术。
5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。
推理研发工程师
岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。
4. 熟悉LLM相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
对齐算法工程师
1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning、多轮对话等能力;
2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;
职位要求
1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验;
2.熟练使用pytorch/tensorflow深度学习框架,熟练掌握Transformer框架;
3.对 LLM 有深入理解和实践,有SFT、RLHF相关经验者优先;
4.较强的工程实现能力,熟练掌握C/C++, JAVA,Python等至少一种语言;
搜索增强算法
主要职责:
1. 设计和实现基于深度学习的搜索增强大模型,提高搜索结果的准确性和相关性。
2. 开发和优化多模态检索与混排算法,包括图像、视频和文本等,以提高跨模态搜索的性能。
3.分析和优化搜索算法的效果,通过数据驱动的方法持续提升搜索系统的表现。
4.与产品团队合作,理解业务需求,为搜索系统的设计和优化提供技术支持。
跟踪最新的搜索增强和多模态处理技术,探索并应用新技术以改进现有系统。
职位要求
任职要求:
1. 计算机科学或相关专业硕士及以上学历,具备搜索推荐或自然语言处理背景。
2. 至少2年的大模型算法研发相关工作经验,熟悉深度学习框架(如TensorFlow或PyTorch)。
3. 熟练掌握编程语言(如Python),具备良好的编程能力和算法基础。
4. 具备良好的数据分析和解决问题的能力,能够独立进行算法效果评估和优化。
5. 有强烈的责任心,良好的沟通能力和团队合作精神,对技术创新充满热情。
6. 动手能力强,有实际项目经验者优先考虑。
多模态算法工程师
职位描述
1.深入研究并探索视觉语言模型(VLM)、多模态大语言模型(MLLM)等尖端技术。跟踪多模态AI领域的最新技术动态,优化和改进现有技术和系统。
2.研究多模态模型的训练范式,探索更高效的结合范式,并以此为基础发表高价值论文。
3.探索多模态数据利用方式,对图文对, 图文交错等数据有更高效的使用方式。
职位要求
1.熟悉Python, Linux, PyTorch等深度学习必备知识,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识。
2.有在ICLR、ICCV、CVPR、ECCV、NeurIPS、ICML、TPAMI、ACL、EMNLP等国际顶级会议和期刊上发表成果的优先。
3.熟悉预训练算法的历史,熟悉对比学习,MAE等大语言模型之前的预训练算法,有Visual-Language Model和大规模语言模型(LLMs)方面的经验者优先。
4.熟悉Flamingo, Llava, Fuyu等多模态大模型的基本原理与优劣,熟悉MMMU, MathVista等多模态评测方式
5.具备优秀的团队合作意识和沟通能力,出色的自我驱动和抗压能力,强烈的求知欲和技术热情,优秀的数据分析和逻辑思维能力。
6.对多模态模型如何提升当前语言模型能力有独到的见解
7.博士及以上学历(或者参与过出知名多模态项目的硕士)
加分项
1.在高影响力项目中做出过核心贡献者优先考虑。
--
FROM 101.18.51.*