[译] 蚂蚁如何启发 Rodney Brooks 打造 Roomba 扫地机器人
本文翻译自 Forbes 采访视频 How Ants Inspired This Founder To Build A Robotic Vacuum Cleaner,受访者为机器人学家、iRobot 联合创始人 Rodney Brooks。采访地点位于 HP 车库——硅谷的发源地。
采访人:Carrie Dolan(Forbes)
受访人:Rodney Brooks(MIT 机器人学教授、iRobot 联合创始人、Robust AI 创始人)
Carrie Dolan:欢迎。我是 Forbes 的 Carrie Dolan,今天我们在 HP 车库与 Rodney Brooks 对话。这里是硅谷的诞生地,Hewlett-Packard 正是以 Bill Hewlett 和 Dave Packard 的第一项发明在此起步。Rodney 因其入选 Forbes “美国 250 位最伟大的创新者”榜单而来到这里,一个略为神秘且有趣的描述是”受蚂蚁启发”。他创造了 Roomba 扫地机器人,所以我很想听听关于蚂蚁的故事。Rodney 是机器人学领域的长期研究者,曾任 MIT 教授。Rodney,感谢你来到这里。
Rodney Brooks:感谢邀请。
早期经历:从数学到计算机
Carrie Dolan:在谈论你的机器人职业生涯之前,先聊聊是什么让你进入机器人领域的?这是你小时候的第一兴趣吗?你是在澳大利亚长大的,对吧?
Rodney Brooks:是的,我在澳大利亚长大。我母亲给我买了两本美国的《How My Wonder Books》——一本关于电学,让我学会了搭建简单电路;另一本我记得叫《Computers and Giant Brains》,里面有机器人,主要是虚构的机器人。所以从六七岁起,我花了大量时间在后院的棚屋(我们称之为 garage)里尝试制造东西。我不太擅长机械部分,所以那些机器人从未真正走远。于是我将精力集中在搭建能做游戏、学习等事情的电路上,用许多非常廉价的元件——因为我没有太多预算。直到十来岁时,我才成功造出真正能动的机器人。
Carrie Dolan:那么大学本科阶段你攻读工程或电气工程了吗?
Rodney Brooks:我进了一所很新的大学。那里数学系很强,我于 1972 年初入学。数学系里挤满了布拉格之春(Prague Spring)的难民教授。因此,我接受了古典东欧式的数学教育。那所大学有一台大型计算机(mainframe),仅有 16 KB 内存,使用打孔卡。平日里有四名全职操作员负责将任务送入机器。但有一位来自捷克斯洛伐克的 Koutsky 教授设法让我每个星期日独享这台计算机 12 小时。于是每周日从上午 9 点到晚上 9 点,我和另一名学生可以完全使用那台机器。我自学了计算机科学,并构建了人工智能程序。
Carrie Dolan:真的是自学?没有人教你如何使用?
Rodney Brooks:从书上学的。
Carrie Dolan:那你在周日的那些时间里做什么?写程序吗?
Rodney Brooks:我写了一整门 AI 语言。我构建的最好的程序是一个能做符号积分的程序——不是数值积分,而是输入公式后进行符号化积分推导。由于只有 16 KB 内存,我不得不实现虚拟内存(virtual memory)才能有足够空间工作。
通往机器人的道路
Carrie Dolan:那么你后来来到美国——是本科毕业后直接来的吗?
Rodney Brooks:我在澳大利亚完成了一个研究型硕士学位,主题是机器学习,但当时澳大利亚还没有这个方向。我是在书上读到它的。说实话那是一篇很糟糕的硕士论文,糟透了——一位评审说应该让我挂掉,另一位说应该通过,幸运的是我过了。但我知道我必须去别的地方。于是狂妄地申请了美国最顶尖的地方,恰好被斯坦福录取了——那是 1977 年。我常跟人说我很幸运,因为到了 1979 年前后人们才意识到计算机科学的重要,到那时我就进不去了。
Carrie Dolan:那么从斯坦福的计算机科学博士到 MIT 的机器人学教授,中间经历了什么?
Rodney Brooks:在斯坦福时,我是一位叫 Hans Moravec 的研究生的助手——人们可能听说过莫拉维克悖论(Moravec paradox):移动和抓取是困难的,但智力活动在构建 AI 系统时相对容易。我是他的办公室室友。他有一台机器人,试图让它穿过一间 60 英尺长的房间。每天深夜其他人回家后,大型机负载降低时,我帮他部署,然后他的机器人每 15 分钟大约移动 1 码。如果运气好,到早上 6 点它能到达房间另一端。那是一台四轮的装置,就像一张放在轮子上的牌桌。
我的博士论文做的是纯机器视觉——分析卫星图像、尝试解读图像内容。顺便提一句,以展示当年条件之不同:在整个博士期间,我只处理了三张图像,三帧。仅此而已。在大型机上处理每张图像需要数周。总之,我于 1981 年以博士后身份加入 MIT,进入一个机器人研究组。
Carrie Dolan:是因为你的办公室室友让你对机器人产生了兴趣?
Rodney Brooks:是的。然后我开始从事机器人研究,先后在 MIT 和斯坦福任教。
创业与 Roomba
Carrie Dolan:在此过程中你也成为了创业者,联合创办了多家公司。
Rodney Brooks:是的。当我还在斯坦福任教时——就在我要离开的时候——我们一群人创办了一家 AI 软件公司,产品运行在最早的 Sun 工作站上。那家公司持续了大约 8 年,做的是专家系统(expert system)软件。人们可能不记得了,在上世纪 80 年代,专家系统曾是风靡一时的事物,被认为将接管世界。
Carrie Dolan:但似乎没有完全如愿。
Rodney Brooks:它们仍然存在,但只是作为组件,而非如当时人们所想象的无所不能。这是一个很好的教训——因为一波又一波的技术被预言将无所不能,而我们不可避免地在每一波浪潮过后发现,除了”当下最热门的事物”之外,还需要很多东西。
蚂蚁的启发
Carrie Dolan:Forbes 提到你受蚂蚁启发,然后创造了 Roomba。这之间的关联是什么?
Rodney Brooks:我那时在泰国一个非常偏远的地区,因为我娶了一位来自澳大利亚的泰裔同学,我们有了孩子后一起待在她长大的地方。周围的人基本都说泰语,而我泰语不太好。于是我就经常坐着观察昆虫的活动——蚂蚁和蝎子让我着迷。然后我意识到,它们在做许多事情上远胜于我们当时的大型移动机器人。它们体型微小,没有 10 万个神经元。相比之下,我们试图用大型计算机驱动物体移动。它们觅食、躲藏、进入洞穴,做各种各样的事情。这让我思考:”好吧,我必须重新思考智能的组织方式。”这使我开始探究所有动物都具备的底层基础能力——对于我们人类或其他小型动物来说,智能是建立在这些底层能力之上的。但那底下的东西究竟是什么?我接下来数年就在做这件事,而 Roomba 的控制方式正是从这项研究中产生的。
Roomba 的传感器与真实世界的挑战
Carrie Dolan:Roomba 有传感器,告诉它”撞墙了”或”该往哪里走”,对吧?
Rodney Brooks:有一整套传感器。第一版中有朝下的红外传感器、触觉传感器。我们还必须监测前方,因为绝不能让 Roomba 从楼梯上掉下去——那是一件重物砸下楼。我们用了三重冗余(triply redundant)系统,其中一套甚至不经过板载微处理器。多种传感器协同工作以了解周围环境。
最初的 Roomba 只是随机游走。它们碰到物体后改变方向。但如果检测到灰尘,我们会让它们原地打转——通过气流通道中颗粒碰撞产生的”颠簸感”来判断是否有灰尘。我们在一个高的厂房里搭建了一个模拟公寓来测试各个房间。但真实人家的床底下积了很多灰尘。当 Roomba 开进床底,看到灰尘就停下转圈,转了一圈又一圈,直到电池耗尽或尘盒填满——然后它就停在原地,而它在床底中间,没人够得着它。
所以我们必须做一些改进。我们也把尘盒容量增大了三倍。在我们的模拟公寓里我们一直在打扫,完全低估了有些地方的积尘量。
Carrie Dolan:这正是 Roomba 的好处——能钻进普通吸尘器钻不进去的床底。而且厨房柜子下面有个踢脚板空间(kick space),Roomba 也必须进得去,所以高度就不能太高。
iRobot 的创办与 Roomba 的上市
Carrie Dolan:你是和 MIT 的几个人一起创办 iRobot 的?
Rodney Brooks:是的,和我两位学生 Colin Angle 和 Helen Greiner。
Roomba 是在公司成立 12 年之后才推出的。在那之前我们做了很多其他项目。Roomba 于 2002 年上市。
Carrie Dolan:你现在已经不再参与这家公司了?
Rodney Brooks:不参与了,我在 2011 年退出了董事会。后来亚马逊曾想以很可观的价格收购,但反垄断(anti-trust)等顾虑出现了。不过我不再参与,所以不了解那些细节。
Robust AI:仓库自动化
Carrie Dolan:你后来又创办了多家机器人公司。你现在做的是 Robust AI?
Rodney Brooks:对,Robust AI。我们制造智能手推车——听起来极其无聊,但极其重要。
在 COVID 疫情期间,我们加速了在线购物习惯——每天收到的那些包裹是在履约中心(fulfillment center)里由人员将商品装入箱子的。商品从哪里来?从货架上取。亚马逊在 2000 年代收购了一家波士顿的 Kiva 公司,那里的机器人把整架货架运到拣选员面前。但这仅占所有仓库的极小一部分。绝大多数仓库中,人工拣选员推着手推车出去,将货物拣入车上的不同箱子,然后推着沉重的手推车到达包装区。这些工人每天行走 超过 30,000 步——这对身体是极大的负担。而且存在严重的劳动力短缺问题,人们普遍不愿长期从事这项工作。
我们的机器人可以大幅减少工人步数。手推车装满后自动离开——它知道所有拣选任务已完成。你从机场起飞时看到的那些扁平的建筑物、停着很多卡车的——那些全是履约中心,通常达百万平方英尺。你可以在任何方向上走一千英尺,而这正是你需要推车做的事。现在机器人代劳了。此外,机器人还会引领工人——它知道货物在哪里,亮起箭头指示位置。工人取下货物、扫描,然后机器人亮起指示灯显示该放入哪个箱子。与之对比,目前普遍的做法是:工人面对一块小小的绿色屏幕——仿佛模拟着 80 年代的固定尺寸终端——需要读出 10 位代码进行匹配,才能确定该取什么零件。
我们花了 7 年才走到这一步。人们总是低估硬件真正可运营所需的时长。这是我们第一阶段的产品。我们以服务形式(机器人即服务)销售。全球最大的第三方物流运营商是 DHL 供应链,这也是我们最大的客户,同时我们也在与许多其他客户合作。美国大概有 10 家主要的运营商。
Carrie Dolan:有竞争对手吗?
Rodney Brooks:有其他公司。不过我们当然相信我们做得更好,因为我们起步更晚,能够利用深度学习革命带来的 GPU 的馈赠。我几乎认为 NVIDIA 是世界上最幸运的公司——他们开发了图形处理单元(GPU)用于加速游戏,结果发现这些芯片在神经网络计算上也极为出色。于是人人都在追逐更多 GPU。更早进入这个领域的公司没有 GPU 可用,只能使用不同的技术。而我们使用 GPU,可以每隔几个月就更新模型,持续大幅改进。
对人形机器人的质疑
Carrie Dolan:现在有一股人形机器人(humanoid robot)热潮——Tesla 在做,Figure AI 在做,还有一堆其他公司。你曾公开表达对这股潮流的怀疑。能谈谈原因吗?
Rodney Brooks:先补充一个数据:中国有 140 家人形机器人公司。我对此持怀疑态度。
我在 MIT 时,iRobot 独立出去后,我不想让我的研究生觉得他们在为我的公司做事,于是我在 1992 年转向——开始打造人形机器人,这是美国最早的人形机器人研究。我们造了一系列大约 7 个人形机器人,第一个叫 Cog(类似齿轮和认知的含义)。2010 年我离开 MIT 后,创办了一家人形机器人公司,制造了约 4,000 个人形机器人在新罕布什尔州和马萨诸塞州生产。我们最大的市场其实是在中国——用在工厂里。它们没有腿,只有上半身,但有很长的双臂(因为没有髋关节——人类够东西时大量使用髋关节),且具备力敏感能力。任何人都可以在任何时候抓住机器人的手臂并将其移开。我测试安全性的方式是——每个人都知道——把头伸过去让机器人撞。大家因此知道我对待安全问题是认真的。这必须安全。
关于当前的人形机器人:我去年十月写了一篇两万词的长文,论述我认为为什么当前的人形机器人不会学会灵巧操作。核心原因是:它们大多基于观察人类动作进行模仿学习,但关键不在于运动轨迹本身——运动轨迹是由人体感受到的力决定的。而许多公司恰恰忽略了力觉与触觉。我们的手上有 18 族触觉神经元(18 families of touch neurons),我们感知力。如果没有这些,我认为我们不可能获得接近人类的灵巧性。存在经典的实验:仅仅麻醉人的指尖,然后让他们完成一个 10 秒前还能轻松完成的任务——他们就做不到了。我们甚至没有意识到所有这些神经元是如何赋能于我们双手的。
好消息是,一批小公司正在组建,专攻机器人手上的力传感和触觉传感。他们都来找我说”你愿意做顾问吗?”所以我现在为其中几家提供咨询服务。
Carrie Dolan:所以你说现有的人形机器人缺乏的东西,现在有公司在做了。
Rodney Brooks:是的。公平地说,学术界一直有很多人在做这方面的研究。但现在有了 VC 说:”也许我该投资其中一家公司。”以前这只是学术界遥远角落里无人兴奋的领域。
关于人形机器人的演示视频:如果你知道要看什么,你会发现很多视频玩了花招。例如清空洗碗机的视频——你看,洗碗机里只有四个盘子;机器人移动得很慢;而且它不是在放下盘子直到表面接触——它在接触之前就把盘子丢下来了,因为表面接触意味着力交互,而它们无法处理力。所以有一整类的人形机器人视频,懂行的人能看穿其中的技法。我并不是说他们在故意误导——某种程度上他们自己也相信。”看,我能让它跑起来了”——但这并不是按照人类工作方式在运行。
在制造或任何场景中,人们都希望动作快。而且机器人面对的不是人——它在与物理学对话。而物理学不会迁就你。物理学不会说”哦这只是一台机器人,我区别对待一下”。没有容错空间。
美国创新体系
Carrie Dolan:你入选了 Forbes “美国 250 位最伟大的创新者”榜单,与合众国 250 周年纪念相关。你在这个国家已经住了很长时间,你怎么看美国制度在你所经历的时期内促进创新的作用?以及美国要为下一个 250 年的伟大创新做些什么?
Rodney Brooks:第二个问题更难回答。我可以回溯过去,告诉你什么曾经有效、且仍在有效。
这真正起步于二战之后。战争期间大量大学投入到各类研究项目——机载雷达、核武器等。最高层做出了一个决定:由美国政府向研究型大学提供资金。一直有人抱怨这不公平——别的机构拿不到这些钱。但卓越中心(center of excellence)被强力推动。于是在漫长时间里产生了海量成果。这需要很多很多失败的路径——你必须接受这点,因为你不知道哪些会成功。
深度学习(deep learning)就是一个例子——它于 2012 年真正爆发,但基础技术是 Bernie Widrow 于 1960 年在斯坦福开发的。Widrow 去年去世了。此后经历了六代迭代,每一代结束时大家都说”它还是不行,还是不行,还是不行”——最终它成功了。所以你永远不知道。必须持续走下去。
不幸的是,现在正在发生的趋势是:因为大型语言模型表现惊人——语言能力完全出乎意料地好——政府资金正在从许多其他方向转向全力押注 AI 和量子计算。其他领域正在被抛在后面。即使是计算机科学中不属于 AI 的领域也在被忽视。那些原已接近突破的 AI 技术现在将无法获得资金。世界变了,而且变化在最近一年半中异常剧烈迅速。
我一直告诉人们,世界不断变化,我们必须适应。但我不确定风险投资的资金是否有长期耐心。我确信当前风投圈热捧的很多东西会戏剧性地失败——因为它们甚至还没经过实验室验证。如果没有实验室级别的验证,成功的概率大约是十分之一能走远一点,百分之一走得更远,千分之一能真正走远。但没有足够的风投资金来下所有这些赌注。VC 投的项目应该比大学基础研究走得更远,但这并不是现在正在发生的事。我不是在贬低风投——他们有自己试图运行的模式——但我认为这个系统出了点问题。比一点点问题更严重。
现在该回到过去吗?我不知道。我们从来没有真正回到过从前。我们不断变化。鸡蛋碎了,我们无法复原。我们该换新鸡蛋吗?我不确定。
HP 车库里的这一张沙发上——这里曾用电子管(vacuum tubes)做收音机,然后 Hewlett-Packard 转向制造音频振荡器,进而发展出测试设备。从那里走向了现代电子学。没有现代电子学就没有硅芯片电子学,就没有计算机,就没有今天的一切。那些人在做的事情在当时看来就是”为什么不多造几台收音机呢?”他们说:”不,我们要做不一样的事情。”你永远不知道未来会走向何方。
原文:Forbes — How Ants Inspired This Founder To Build A Robotic Vacuum Cleaner
受访者:Rodney Brooks(Rodney Brooks on Wikipedia)