业务介绍:
向量数据库当前是业界热点,可以在幻象降低、推理加速、成本降低、隐私保护等方面增强LLM。向量数据库应用的关键技术包括向量表征和向量检索。1)通过向量表征模型实现数据的向量化,当前主要针对文本数据,后期涉及图像,关键是如何优化表征模型提升业务查询精度。2)通过向量检索实现海量高维向量(亿级乃至千亿级)的快速高精度检索。
工作内容:
1)工程开发:业界开源算法复现、团队自研算法的实现,代码的测试调优;
2)算法设计:与团队成员共同进行算法的优化设计,并进行开发验证,挑战业界最优。
工作职责是负责进行(工程开发)或(工程开发+算法设计)
团队情况:
国内外top高校博士,CMO等各类竞赛获奖者。 向量检索方面权威测评框架annbenchmarks当前业界第一。
岗位要求:
要求985、211硕士或博士,博士有转正机会,硕士可推荐相关部门。
1. 良好的计算机基础,熟悉 Python或C/C++,有很强的算法实现能力(必须)
2. 熟悉对比学习、稠密信息检索算法,有文本、图像表征模型的训练调优经验(可选)
3. 有CLIP模型调优、M3E、BGE等文本表征模型训练调优经验的优先(可选)
4、有神经网络模型压缩经验的优先(可选)
工作地点:北京上地七街华为大厦/清华科技园黄大年茶思屋/环保园
联系方式:简历请发送到
jiangweipeng@huawei.com
--
修改:kirrin FROM 111.199.188.*
FROM 111.203.139.*