博雯 发自 凹非寺
量子位 | 公众号 QbitAI
那群曾经集体后空翻、踢足球的MIT机器狗迷你猎豹(Mini Cheetah),瘸了?
但你别说,走得依旧挺欢快:
这可不是MIT科学家们在侵犯“机器狗权”,而是因为狗子们在新技术的加持下又进化了。
不仅坏了一条腿也能走路,之前寸步难行的碎石路更是不在话下:
还能在结冰路面转圈撒欢儿:
不瘸的时候,速度最快能到3.9m/s,尥蹶子跑起来时,开发员只能抱着电脑在后面追得跌跌撞撞:
而上述所有的技能,最原版(也就是开源那版)的MIT机器狗仅用了3小时就完全掌握。
如此强大的学习能力到底从何而来?
3小时积累100多天奔跑经验首先,机器狗们的各种行为都依赖于身体里的一个专门的控制器。
工程师们会通过分析运动的物理规律,制定有效的抽象概念,再去设计并实现专门的控制器层次结构,使机器狗能够在运行时保持平衡。
但要提前人为分析、建立所有可能的地形分析,并使机器狗快速识别对环境的变化作出反应,并不简单。
例如,草地上的一小块结冰面,碎石堆上突然出现的大块凸起,都有可能使机器狗再起不能:
(所以说…不要停下来啊!)
人为设计的控制器,出现问题自然也得人为分析原因,再手动调整,一来二去的时间成本就大大增加。
怎么办呢?
MIT的科学家们表示:
让机器狗自己学!
研究团队开发了一种模拟环境,其中包含了多个地形,再将狗子放在其中进行训练。
在训练期间,他们加入了神经网络,让机器狗从不同地形的跑步和失败经验中总结规律,进而自己找出适应新地形的最好方法。
仅仅3小时,模拟世界中的迷你猎豹就积累了100天的多样化地形奔跑经验。
并且,团队也为机器狗部署了一种基于端到端的传感运动策略的控制器。
这种控制器会将关节编码器和IMU(惯性测量单元)数据直接转换为关节指令,没有了额外的状态估计或控制子系统,机器狗在进行敏捷或极限的动作时,便会更加得心应手。
这时的迷你猎豹,就变成了一只经验丰富的狗子。
刚刚还被绊倒的路沿,现在已经能自信地迈过去了:
高速奔跑中也不会被地上的线绊倒:
室内转圈的速度能达到5.7rad/s(每秒320°,近一圈):
研究来自MIT CSAIL这次的研究来自于MIT的计算机科学与人工智能研究院(MIT CSAIL),论文和代码很快会公开。
一作Gabriel Margolis为MIT的一名博士生,主要研究领域是具身智能(Embodied Intelligence),即开发能与真实世界进行多模态交互的具有身体的人工智能。
共同一作Ge Yang本科毕业于耶鲁大学,获得了物理学和数学学士学位,后来在芝加哥大学获得物理学博士学位。
现为美国国家科学基金会(NSF)的AI与基础交互研究所(IAIFI)的一名博士后。
视频:
https://www.youtube.com/watch?v=-BqNl3AtPVw参考链接:
[1]https://sites.google.com/view/model-free-speed/[2]https://news.mit.edu/2022/3-questions-how-mit-mini-cheetah-learns-run-fast-0317[3]https://venturebeat.com/2022/03/17/mit-researchers-use-simulation-to-train-a-robot-to-run-at-high-speeds/— 完 —
量子位 QbitAI · 头条号签约