从蹒跚学步到学会跑酷,盘点Atlas机器人六年的进化之路
自2016年首次亮相以来,波士顿动力双足机器人Atlas已经红了整整五年半。
这个站在机器人研究金字塔尖的神奇“物种”一路飞速进化,刚出场时其形象还人不人鬼不鬼,在滚动履带上甩着两条扭曲的大长腿,随后不仅外观越来越炫酷,而且新技能不断刷新人类认知。
从踩碎石爬雪地到撑杆跳后空翻,从蹒跚学步到高难度体操跑酷,每当波士顿动力放出Atlas新视频,评论区总能听取“哇”声一片。这些神乎其神宛如CG特效的炫技背后,是波士顿动力Atlas四个团队协同作战修炼的苦功。
六年之间,波士顿动力在双足机器人平衡控制、行动规划等技术方向如何迭代进化?哪些硬核科技成就了灵敏度和爆发力越来越强的Atlas?
一、从蹒跚学步到学会跑酷,Atlas的受虐之路
最早让波士顿动力走红的,应该是他们在2010年发布的这段“虐狗”视频。
早期的波士顿动力与美国军方有着密切的合作,研究资金也大多来自美军资助。上面这只受到“虐待”的机器人就是波士顿动力为美军开发的用于运输货物的四足仿生机器人BigDog,它以“踹不倒”的能力走红网络,直到现在这段“虐狗”视频还会被网友拿来调侃。
Atlas有着和Bigdog一样的遭遇,它成长的路上也伴随着各种“虐待”。对于Atlas来说,被工程师从背后一把推倒摔个“狗吃屎”是再常见不过的事情。
Atlas的前身是为美军测试防护服性能的双足机器人Petman,早在2009年的时候原型机就已经亮相,这时的Petman只有两条腿,需要拖着电缆在履带上晃晃悠悠地行走,它的受虐之路也正是由此开始。
2013年,初具人类外形的Atlas原型机亮相,这时的Atlas已经能够在碎石堆上行走,受到的“虐待”也变得更残酷,它不仅要“金鸡独立”,还要承受大摆球的撞击。
时间到了2016年,也就是波士顿动力被谷歌收购后的第三年,我们所熟悉的那个Atlas终于正式亮相。它的外观已与现在会跑酷、会跳舞的Atlas无异。但这时的Atlas仍是个“婴儿”,尚在蹒跚学步阶段,走路踉踉跄跄,动作也不连贯。网友调侃说它像极了一个半夜里走在回家路上的醉汉。
尽管如此,Atlas受到的“虐待”丝毫没有减少,反而还变本加厉了起来。比如,当Atlas费劲半天力气搬起箱子时,工作人员一棍子将箱子打掉,还“粗暴地”推上它一把,让它险些摔倒。
再或者,工作人员直接从Atlas背后推上一把,让它的面部和地面来一个亲密接触,趴在地上久久不能动弹。
尽管机器人并没有情感和痛觉,对于这样的“欺凌”不会感到伤心或难过,但这样的画面仍然引起了一部分网友的同情,纷纷留言道:“不要再欺负那个可怜的家伙了!”“我真的为机器人感到难过。”
当然,这代Atlas离“完美”还有很大的距离,它的动作仍不连贯, 跳起来落地后依旧会踉跄甚至摔倒。不知道波士顿动力是不是听到了网友的呼声,他们没有再放出“虐待”Atlas的镜头。
时间又过了一年,Atlas学会了跑步,能够边跑边越过原木、跃上台阶。
到了2019年,Atlas掌握了“体操”技巧,能够连续的跳跃、翻滚、倒立。
被软银收购后,波士顿动力一直希望能够开启商业化之路。2020年中旬,波士顿动力首款商用机器狗Spot正式开售,售价折合人民币将近50万元。显然这个售价很难给波士顿动力带来太多销量。据彭博社报道,截至2020年底,Spot仅被卖出了大约400台。
与波士顿动力漫长的商业化之路相对应的是,开发机器人需要大量的投入。或许正是因为这个原因,让软银最终选择将波士顿动力出售。2020年底,现代汽车集团宣布将收购波士顿动力。今年6月份,现代正式宣布从软银手中购得了波士顿动力80%的股份,获得波士顿动力的控股权。
不过,Atlas的成长依旧未受到易主的影响,在2020年即将结束之际,波士顿动力发布了一条Atlas跳舞的视频。在这条视频里,两个Atlas机器人随着音乐翩翩起舞,因动作过于流畅自然,以至于不少网友认为这是CG特效。
两周前,波士顿动力展示了Atlas的最新成就——跑酷。这段视频里,它连续地越过台阶,跑过斜坡,走过平衡木,甚至还单手支撑身体越过横杆,一系列动作下来灵巧度不输人类。
波士顿动力的工程师还透露,这一代的Atlas并非像以前一样通过事先编程完成整条路线,而是靠它自身的传感器感知环境,从而自主行动。
尽管Atlas已经能够如此流畅地跑酷,但摔跤对它来说依旧是一件不可避免的事情。跑酷过程中Atlas仍会失去平衡而摔倒,甚至有时为它提供动力的液压管会突然爆裂,让它瞬间“瘫痪”在地。
Atlas正是在不断地摔跤中逐渐从蹒跚学步成长到可以流畅跑酷。在波士顿动力内部,“建造它、摔坏它、修好它(Build it, Break it, Fix it)成为了一句广为流传的口号。
对于波士顿动力的工程师而言,Atlas不断地摔跤和与障碍物之间的碰撞都是研究团队学习过程的一部分,这让Atlas身上需要改进的地方得以暴露,为他们提供了改进机器人的机会。
二、五年时间,环境感知和适应性得到提升
对Atlas来说,能够适应各种环境,保持身体平衡从而避免在行走、跑步、跳跃过程中摔跤是头等大事。为了做到这一点,从它对环境的感知能力到对环境的适应能力在这五年间经历了多次迭代。与此同时,它自主行动的能力也得到了增强。
1、从“醉汉”到“跑酷者”,Atlas身体协调性得到提高
最初的Atlas走路踉踉跄跄,行走过程中身体仍较为僵硬,在快要摔倒的时候无法调动全身,只会通过改变步伐来重新寻找平衡。它的双臂更是像“焊死”了一样,一动不动,因此网友评价它说像极了一个醉汉。
走路踉踉跄跄的Atlas
在接下来的几年内,Atlas逐渐学会了挥动双臂来保持身体平衡,对全身的调动也变得越来越灵活,甚至学会了倒立、跳马、跳舞和跑酷,其动作越来越接近人类。
然而,这并非单纯的对人类的模仿。机器人身体结构和人类有很大差别,比如它没有脊椎和肩胛骨,同时手臂也相对较为脆弱。因此团队必须不断地在它的尺寸和复杂性之间对它的重量、强度、活动能力等各种要素进行权衡,并对控制算法进行优化,来更好的协调它的各种动作。
尽管跑酷是一项小众运动,但是它作为一项需要调动全身的活动,要求Atlas做到在各种条件下保持身体平衡,并做到在各种动作之间的无缝切换,这为Atlas团队提供了一个完美的测试条件。
波士顿动力在IEEE Spectrum的一次采访中提到,Atlas开发团队正在利用跑酷来推动Atlas处理更多复杂的动态行为,目前仍只是一个开端,在接下来的几年内它将学会利用手臂拓展更多活动能力。
2、从提前预设行动到自主规划路径
如果你看完了Atlas这五年内的8条视频,可能会感觉Atlas在最近几年的进步没那么明显。比如,在2017年的时候Atlas就能够在台阶之间跳跃,还能进行后空翻。一年后,它又学会了一边跑步一边跃上几层台阶。在这样的成长轨迹下,Atlas学会“跑酷”似乎也是理所应当的。然而,Atlas实现这一系列动作背后的基本过程已经发生了巨大的改变。
最初的Atlas由人进行遥控,控制它的行走方向。如果想要它完成某项挑战(比如跑酷或跳舞等),需要提前对各种动作进行动态捕捉,然后将捕捉到的动作连成可执行的程序。这时的Atlas只是机械的完成相应的任务,而并没有与环境产生互动。
在Atlas最近的这次跑酷中,研究团队已不需要提前对它的行动进行规划。在跑酷之前,研究团队为Atlas提供了一张高级地图,其中大致描述了它的行动路线和相应位置应该做出的动作。跑酷过程中Atlas利用这些信息来为自己导航,并且它可以对环境进行感知,根据实时感知到的数据自主规划整个行动以完成挑战。
Atlas执行的每个动作都源自其行为库中的动作模板,它可以根据目标情况自主从库中选择相应的动作执行。跑酷过程中,Atlas的模型预测控制器(MPC)会调整其发力、姿势、动作发生时机等细节,来应对环境、脚滑等各种可能实时出现的因素。这意味着研究人员不必为Atlas的行动逐个调整细节,它的控制器就可以做到。
并且,MPC还允许Atlas跨行为边界预测下一步的行动,比如它知道了这次跳跃后是一个后空翻后,就可以自动地创建从一个行为到下一个行为的过渡,使每一步动作都自然的连贯起来。
3、TOF深度传感器构建“3D地图”
Atlas能够根据环境自主规划行动,得益于其环境感知能力的提升。
最初版本的Atlas头部装有激光雷达和立体传感器,这能够帮助它躲避障碍物、识别地形变化、辅助导航等。在2018年的迭代中,Atlas可以利用计算机视觉来标记和定位自己,以帮助其在跑步和跳跃过程中准确定位落脚点。
但是这还远不能支撑Atlas自主行动,它需要将传感器数据转换为对决策和规划身体动作有用的信息,以识别障碍物和自主导航。
现在,Atlas可以利用头部的RGB摄像头和TOF深度传感器获取更加全面的环境信息。TOF深度传感器以每秒15帧的速度生成环境的点云(point clouds)。点云是大量测距结果的集合,Atlas获取到环境的点云后,它的感知软件会利用一种称作多平面分割(multi-plane segmentation)的算法从中提取平面,并输入到一个映射系统中,构建出Atlas看到的不同对象的模型。
这就相当于为Atlas构建了一张3D地图,Atlas跑酷过程中正是基于它构建的这个模型来规划路径,计算每一步的落脚点。
三、Atlas机器人如何感知世界
机器人该怎么样才能像运动员一样奔跑、翻转、跳跃?创造这些高能演示的是一个有趣的挑战,但波士顿的技术目标不仅仅是创造一场华丽的表演。在Atlas项目中,他们以跑酷为实验主题,通过动态运动,感知和控制之间的联系,来研究相关的问题。这些问题的解决有助于机器人更加顺畅的运行。
机器人感知算法会被用到相机和激光雷达等传感器的数据转换对策和规划物理行动中。虽然Atlas使用IMU、关节位置和受力传感器来控制其身体并感受地面获得平衡,但Atlas还需要感知算法来识别障碍物,如图1中看到的木箱和窄桥。
Atlas使用深度相机以每秒15帧的速度生成环境点云。点云是距离测量数据的集合。Atlas的感知软件使用多平面分割的算法从点云中提取表面。接着算法输出的数据被输入地图系统,最后系统帮助Atlas用相机看到不同物体建立模型。
为了扩展跑酷课程,机器人被导入一张高级地图,其中包括命令它去哪里,以及路上应该做什么动作。这张高级地图与实际课程不完全一致,它是对障碍物位置和一些主要动作的简要描述。所以Atlas会使用这些简要的信息来导航,同时使用实时感知数据来填充细节。例如,Atlas寻找一个可以跳跃的盒子,如果盒子移动到侧面0.5米,Atlas会在那里找到并调整姿势。如果盒子移动得太远,系统找不到它就会停下来。
机器人在跑酷障碍跑道上看到的内容和机器人通过内容反馈的计划。主动跟踪的物体被绘制成绿色,当物体的距离超过感知范围时,图标就会从绿色变成紫色。跟踪系统也会不断跟进物体的姿态传给导航系统,导航系统会通过地图上的信息设计好对应物体的绿色脚印。
为未来奠定基础
研究人员对Atlas系统中创建和控制动态行为(也包括舞蹈)有了深刻的理解。但更重要的是,创造了一个可扩展软件系统的机会,也让Atlas系统通过感知自身环境做出改变,这个系统将与他们的团队一起成长。