from gemini:
这个发帖人提到的观点虽然语气很狂(“懒得说自己去看”),但他提到的技术突破确实是**足式机器人(Legged Robots)**领域的里程碑事件。
他所指的 **“2017年左右”、“anymal”、“彻底解决端到端训练”**,主要指的是 **苏黎世联邦理工学院(ETH Zürich)** 的 **Robotic Systems Lab (RSL)** 团队(由 Marco Hutter 教授带领)在 **Sim-to-Real(仿真到真机迁移)** 方面取得的突破性进展。
### 1. 具体的论文是什么?
虽然发帖人说2017年,但这项工作最集大成、最著名的发表是在 **2019年** 的《Science Robotics》,不过其前置研究(会议论文和预印本)确实始于2017-2018年。
最有代表性的论文是:
> **Learning agile and dynamic motor skills for legged robots**
> *Jamin Hwangbo, Juntao Lee, Alexey Dosovitskiy, Dario Bellicoso, Vassilios Tsounis, Vladlen Koltun, Marco Hutter*
> (发表于 *Science Robotics*, Jan 2019)
如果在2017年左右找对应的早期工作,可能是指他们早期的尝试:
> **Control of a Quadruped Robot using Deep Reinforcement Learning** (2017 IEEE International Conference on Robotics and Automation 等相关早期工作)
### 2. 这篇论文解决了什么核心问题?
在 AI 和机器人结合的早期,有一个巨大的痛点叫 **"Reality Gap"(现实鸿沟)**:
* **以前的问题:** 你在电脑里(仿真环境)用强化学习(AI)训练机器人走路,机器人学得很好。但当你把这套 AI 模型拷贝到真实的物理机器人身上时,**它立刻就会摔倒**。原因在于仿真环境无法完美模拟真实世界的摩擦力、电机延迟、地面软硬度等物理特性。
* **ETH ANYmal 的突破(Sim-to-Real):**
这篇论文的核心贡献在于提出了一套方法,让 AI 在仿真里训练出来的“大脑”,可以直接无缝部署到真实的 ANYmal 狗身上,而且**表现比人类手写的控制算法还要好**。
**他们是怎么做到的?(技术干货)**
1. **执行器网络(Actuator Net):** 以前的仿真只模拟刚体物理(比如铁块的碰撞),忽略了电机内部极其复杂的物理特性(齿轮摩擦、反电动势、信号延迟)。Jamin Hwangbo 等人专门训练了一个小神经网络来模拟“电机”本身。
2. **域随机化(Domain Randomization):** 在训练时,故意把地面的摩擦力、机器人的重量参数随机乱改,让 AI 适应各种“恶劣环境”。
### 3. 用户为什么说“彻底解决”?(以及为什么有点夸张)
**为什么他说对了:**
这篇论文之后,机器人控制领域发生个了**范式转移(Paradigm Shift)**。以前大家写代码控制机器人走路(比如波士顿动力的早期Atlas),用的是数学模型(MPC, WBC);现在只要是做四足机器人,大家几乎都在用端到端强化学习(RL)。
**ANYmal 证明了:不需要手写复杂的物理公式,只要给 AI 足够好的仿真环境,它就能学会如何在乱石堆、滑板及被踢踹的情况下保持平衡,甚至比人写的代码更强。**
**为什么他说得有点夸张:**
虽然基础原理通了,但说“彻底解决”是夸张了。
* 现在的机器人还需要解决更复杂的**手眼协调**(比如人形机器人拿咖啡)。
* ANYmal 当年解决的是“运动控制(Locomotion)”,也就是“怎么走路不摔倒”,这只是机器人大脑的小脑部分。
### 总结
这位发帖人想表达的意思是:
这一波机器人热潮(比如 Figure 01、特斯拉 Optimus)的底层控制能力,确实是建立在 AI(特别是强化学习)的基础上的。**早在几年前,ANYmal 的研究就已经证明了:用 AI 训练机器人走路,比传统方法更强、更快、更通用。**
所以他说机器人热潮和 AI 的关系就像“黄金和白银”,意指二者是**强绑定、伴生**的关系。
【 在 lvsoft 的大作中提到: 】
: 黄金跟白银的关系。
: 机器人端到端训练的问题,2017年左右就被anymal的一篇论文彻底解决掉了。
: 具体我懒得说自己去看论文。
: ...................
--
FROM 222.71.196.*