My talk at CCF-GAIR on August 12, 2016.
机器人灵巧手抓取的复兴
大家好,感谢陈主编的介绍。
在座的那一位能在国际象棋比赛中赢IBM深蓝计算机,能在围棋比赛里赢Google的alpha 狗? 人工智能在很多方面已经强过人类很多了。但是还没有一双灵巧的手。世界上最高级的机器人灵巧手也赶不上一个一岁小孩的手能力。通过几千万年的的进化,我们的手已经无所不能。从几千万年前只能抓食物,进化到可以制造工具,创造艺术,并且用我们的双手改变世界。
十六世纪初,文艺复兴时期,科学家,和艺术家们开始对人体自身感兴趣,尤其对人手的神奇功能感兴趣。达芬奇开始研究人手的解刨结构,被人手的复杂程度震惊了。我们双手的重量只占我们体重的百分之一,成人有206块骨头,其中四分之一的骨头在我们的双手里。手是人体机械结构复杂度最高的器官。
在九三年,我第一次看赫赫有名的科幻电影终结者2:审判日时,对终结者机器人T-800的机械手印象深刻。电影里机械手和智能芯片是产生终结者机器人需要的两个最重要的技术。
正面英雄角色John Connor 和他的母亲Sara要毁掉机械手和智能芯片,并且杀掉研发这两项技术的科学家Miles Dyson来拯救人类。而我看完了电影,并没有对人类的未来充满担心和忧虑,而是满脑子的终结者机器人,特别是和人手一样灵活的机械手。我的人生梦想就是像Miles Dyson一样成为第一造出终结者手的人。带着这个远大的梦想,我来到了美国犹他大学,进入了john hollerbach 的实验室读博士。进入实验室的第一天我的梦想就破灭了。
因为我看到了Utah/MIT hand。 我终生的梦想已经被我的导师实现了,而且比我看终结者电影时还早十年。我1993年看的终结者2,这个Utah/MIT hand是1983年造出来的。之后,我才了解Utah/MIT hand的历史,Steve Jacobsen带领的团队在utah 设计并制造了机械部分,John hollerbach带领的团队当时在mit开发了控制和智能部分。Steve Jacobsen今年3月份因心血管疾病去世了。
从83年开始,最近的三十年里,更多的类人机械手被发明。这里只列出有代表性的的四个。每一个机械手都很cool. 都和瑞士手表劳力士Rolex一样设计精密,机械部件精准咬合,有十几个可动关节,传动装置。很多的气动或者电机驱动,还有个共同特点,每一都很昂贵。这里面最便宜的Bionic hand也要三万多英镑, 最贵的要十几万美元。在很多实验室中这些精致的机械手演示各种各样与人手相媲美的能力。可以做家务,做饭。日常起居无所不能。而现实中却没有一款被大规模应用。不光是因为造价昂贵。复杂的机械结构,控制很多的动力装置都十分困难。大家看到的演示,多是精心设计和编排,通过大量编程实现对某个特定场景。
类人机械手很cool. 却难以在实际中得到应用。我们需要的即cool又现在就可以实用的机器人技术。我们不需要完全模仿人手。而可以从工程的角度来设计适于抓取任务的机械手。这个理念连好莱坞都接受了。电影wall-E里,wall-E机器人只有三根手指,而且和人的手指完全不同。Wall-e可以用他的机械手做很多事情。至少在动画片里至少可以在动画片里面换灯泡
从工程角度而不是模仿人体来制作机械手并不是一个新的理念。第一个灵巧机械手Stanford/JPL hand就不是类人手。在这里列出的机械手代表了当前的一些工程设计思想。上边的机械手还有一点点人手的影子,下面的完全是这里面最新的是Rus教授的软体模块化机械手。这些都是从实际问题的出发的工程解决方案。
纯粹的工程解决办法抓取,完全不需要机械手。工业生产里早就有了及简单又完美的解决方案。真空吸盘或者真空杯。上一年在icra, amazon举办了了一个抓取挑战赛。赢得挑战赛的TU-Berlin 团队就是用真空吸杯来吸起amazon的商品,然后放到包装盒里。今年上个月刚结束的amazon抓取挑战赛同样是用真空吸杯的队伍赢得了比赛。而且前三名都是用真空杯。
所以在这个背景下,两年前,美国darpa(need full name)的当时的负者人Gill Pratt就宣布机器人抓取已经解决了。Gill 并不是讲了个笑话。我个人认为,抓取从一个地方抓起一个物体,然后放到另一个地方的大部分问题已经解决。还有些工程问题没有解决。但是抓起工具并使用工具的抓取还远没有解决。
问题的关键并不在机械手本身。而是机器人的智能还不够。终结者电影里机械手和智能芯片是产生终结者机器人需要的两个最重要的技术。我们已经有了各式各样的机械手,甚至有在机械结构上与终结者机器人手类似的机械手,但是却还没有另外一个更重要的技术——终结者机器人的智能芯片。
随着科技的发展,云计算的兴起,好莱坞的科幻电影也从智能芯片和skynet进化到viki. 左边是I robot里的智能中心viki. 我们现在其实也有很多这样的智能中心,包括谷歌的智能中心.
用于云计算, 我实验室发明了一个面向功能对象网络,它是一个存储功能对象和操作信息的中心知识网络系统。这个系统通过处理在线视频比如youtube或者youku上的视频来得到功能对象和操作信息。这个知识网络合起来之后会建立一个很大的知识库,我们通过搜索知识库就可以得到想要的信息.比如,我晚上想吃烤牛排,就告诉我的机器人,机器人通过查询FOON这个知识网络,得到这么一个图,不光给出做烤牛排需要什么原料,还给出所有步骤和每一个步骤需要什么操作动作。这个foon的基本元素里包含了 物体和操作的信息。
操作动作最终还是要由机器人来执行,而很多动作是和物体和环境有实实在在接触的。比如说操作动作是拧螺丝,螺丝刀与螺丝之间有实实在在的接触。手不光要抓紧螺丝刀,使螺丝刀不滑落,而且还要为螺丝刀提供拧螺丝的运动和力。同样的物体, 不同的操作任务也会需要不同的运动和力。自然需要不同的抓握方式。我们的抓握算法可以根据操作任务计算出最适合这个任务的最优抓握方式。
我们做的是根据不同的任务总结出不同的要求,根据这个要求得到最优的手抓解决方案。比如说做锤子,轨迹是定下来了,需要做的是怎么抓机器手运动的少。抓的时候机械手在运动期间鼠标不掉出去,另外一个拧灯泡的例子,同样的例子,在拧灯泡的时候,这个灯泡要跟灯座有实实在在的运作。
虽然计算机智能在很多领域里已经把人类远远的甩在了后面,之所以机器人领域中还有很多问题没有解决,机器人要与现实环境有实实在在接触。这是计算机智能和机器人智能的区别。这是非常大的问题,是一般的计算智能还没有涉及到的问题。我们今年10月份在韩国举办一个抓取和competion,这里有很多的奖品,希望大家组团队去参加。这里面我们发表了9个任务,都是有实实在在基础的任务。从一个碗里面取豌豆放到另一个碗里面,复杂的是机器人抓锯割木板。希望大家更多的来关心机器人灵巧手抓取。
Make grasping great again.