楠木轩

MIT机器狗再进化,碎石冰面上跑也不打滑,这次真的稳如狗了

由 阎桂荣 发布于 休闲

博雯 发自 凹非寺

量子位 | 公众号 QbitAI

那群曾经集体后空翻、踢足球的MIT机器狗迷你猎豹(Mini Cheetah),瘸了?

但你别说,走得依旧挺欢快:

这可不是MIT科学家们在侵犯“机器狗权”,而是因为狗子们在新技术的加持下又进化了。

不仅坏了一条腿也能走路,之前寸步难行的碎石路更是不在话下:

还能在结冰路面转圈撒欢儿:

不瘸的时候,速度最快能到3.9m/s,尥蹶子跑起来时,开发员只能抱着电脑在后面追得跌跌撞撞:

而上述所有的技能,最原版(也就是开源那版)的MIT机器狗仅用了3小时就完全掌握。

如此强大的学习能力到底从何而来?

3小时积累100多天奔跑经验

首先,机器狗们的各种行为都依赖于身体里的一个专门的控制器。

工程师们会通过分析运动的物理规律,制定有效的抽象概念,再去设计并实现专门的控制器层次结构,使机器狗能够在运行时保持平衡。

但要提前人为分析、建立所有可能的地形分析,并使机器狗快速识别对环境的变化作出反应,并不简单。

例如,草地上的一小块结冰面,碎石堆上突然出现的大块凸起,都有可能使机器狗再起不能:

(所以说…不要停下来啊!)

人为设计的控制器,出现问题自然也得人为分析原因,再手动调整,一来二去的时间成本就大大增加。

怎么办呢?

MIT的科学家们表示:

让机器狗自己学!

研究团队开发了一种模拟环境,其中包含了多个地形,再将狗子放在其中进行训练。

在训练期间,他们加入了神经网络,让机器狗从不同地形的跑步和失败经验中总结规律,进而自己找出适应新地形的最好方法。

仅仅3小时,模拟世界中的迷你猎豹就积累了100天的多样化地形奔跑经验。

并且,团队也为机器狗部署了一种基于端到端的传感运动策略的控制器。

这种控制器会将关节编码器和IMU(惯性测量单元)数据直接转换为关节指令,没有了额外的状态估计或控制子系统,机器狗在进行敏捷或极限的动作时,便会更加得心应手。

这时的迷你猎豹,就变成了一只经验丰富的狗子。

刚刚还被绊倒的路沿,现在已经能自信地迈过去了:

高速奔跑中也不会被地上的线绊倒:

室内转圈的速度能达到5.7rad/s(每秒320°,近一圈)

研究来自MIT CSAIL

这次的研究来自于MIT的计算机科学与人工智能研究院(MIT CSAIL),论文和代码很快会公开。

一作Gabriel Margolis为MIT的一名博士生,主要研究领域是具身智能(Embodied Intelligence),即开发能与真实世界进行多模态交互的具有身体的人工智能。

共同一作Ge Yang本科毕业于耶鲁大学,获得了物理学和数学学士学位,后来在芝加哥大学获得物理学博士学位。

现为美国国家科学基金会(NSF)的AI与基础交互研究所(IAIFI)的一名博士后。

视频:

https://www.youtube.com/watch?v=-BqNl3AtPVw

参考链接:

[1]https://sites.google.com/view/model-free-speed/

[2]https://news.mit.edu/2022/3-questions-how-mit-mini-cheetah-learns-run-fast-0317

[3]https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/

— 完 —

量子位 QbitAI · 头条号签约