小米大模型核心团队|学术前沿 + 业务落地双在线
招聘方向大模型智能体算法研究员
团队使命构建行业有影响力的智能体,研究学术前沿打造一流通用大模型智能体解决方案落地小米核心业务
研究方向大模型智能体研究与应用
Agentic Memory
Agentic Workflow
Agentic RL
Agent Application
职位描述:探索大模型智能体研究的前沿技术,构建具备持续学习能力的通用 Agent,包括但不限于:
1、Agentic RL。面向长时序任务的强化学习;Agent 在交互环境中的探索与策略优化;多目标、多约束条件下大模型Agent的决策稳定性与泛化性;Test-time的数据高效Agentic RL;Agent reward model的系统性学习问题;大模型智能体的MARL。
2、Agentic Memory。短期 / 中期 / 长期记忆架构设计;可演化、可压缩、可检索的Memory 系统;经验、技能、失败案例的结构化沉淀;Memory 与 Planning / RL / Tool 之间的协同机制。
3、Agent Workflow。Task Decomposition / Planning / Re-planning;多 Agent 协作与角色分工;反思、自我修正、策略升级;工具集和技能库自演进;自适应和可学习的Agent 工作流。
4、Agent Application。GUI Agent:跨应用、多模态界面下的操作与理解;OS Agent:文件系统、进程、命令、自动化工作流;Deep Research Agent:复杂研究任务、信息整合、假设验证;通用 Agent :跨时间跨任务跨领域的自主学习Agent。
职位要求:1. 计算机相关方向硕士或博士;2年以上智能体算法研究经验;
2. 有大模型智能体相关研究和项目经历,发表过相关方向的顶会论文,或者参与过有影响力的开源项目;
3. 具有优秀的解决复杂问题和多人协作沟通的能力,能够独立思考并开展工作,具有强烈的好奇心和责任心。
base地:北京or武汉
邮箱:sundawei3@xiaomi.com
投递格式:姓名+职位
※ 修改:·sundawei1024 于 Apr 28 15:21:52 2026 修改本文·[FROM: 1.202.162.*]
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 1.202.162.*]
修改:sundawei1024 FROM 1.202.162.*
FROM 1.202.162.*