[译] 蚂蚁如何启发 Rodney Brooks 打造 Roomba 扫地机器人

本文翻译自 Forbes 采访视频 How Ants Inspired This Founder To Build A Robotic Vacuum Cleaner，受访者为机器人学家、iRobot 联合创始人 Rodney Brooks。采访地点位于 HP 车库——硅谷的发源地。

采访人：Carrie Dolan（Forbes）
受访人：Rodney Brooks（MIT 机器人学教授、iRobot 联合创始人、Robust AI 创始人）

Carrie Dolan：欢迎。我是 Forbes 的 Carrie Dolan，今天我们在 HP 车库与 Rodney Brooks 对话。这里是硅谷的诞生地，Hewlett-Packard 正是以 Bill Hewlett 和 Dave Packard 的第一项发明在此起步。Rodney 因其入选 Forbes “美国 250 位最伟大的创新者”榜单而来到这里，一个略为神秘且有趣的描述是”受蚂蚁启发”。他创造了 Roomba 扫地机器人，所以我很想听听关于蚂蚁的故事。Rodney 是机器人学领域的长期研究者，曾任 MIT 教授。Rodney，感谢你来到这里。

Rodney Brooks：感谢邀请。

早期经历：从数学到计算机

Carrie Dolan：在谈论你的机器人职业生涯之前，先聊聊是什么让你进入机器人领域的？这是你小时候的第一兴趣吗？你是在澳大利亚长大的，对吧？

Rodney Brooks：是的，我在澳大利亚长大。我母亲给我买了两本美国的《How My Wonder Books》——一本关于电学，让我学会了搭建简单电路；另一本我记得叫《Computers and Giant Brains》，里面有机器人，主要是虚构的机器人。所以从六七岁起，我花了大量时间在后院的棚屋（我们称之为 garage）里尝试制造东西。我不太擅长机械部分，所以那些机器人从未真正走远。于是我将精力集中在搭建能做游戏、学习等事情的电路上，用许多非常廉价的元件——因为我没有太多预算。直到十来岁时，我才成功造出真正能动的机器人。

Carrie Dolan：那么大学本科阶段你攻读工程或电气工程了吗？

Rodney Brooks：我进了一所很新的大学。那里数学系很强，我于 1972 年初入学。数学系里挤满了布拉格之春（Prague Spring）的难民教授。因此，我接受了古典东欧式的数学教育。那所大学有一台大型计算机（mainframe），仅有 16 KB 内存，使用打孔卡。平日里有四名全职操作员负责将任务送入机器。但有一位来自捷克斯洛伐克的 Koutsky 教授设法让我每个星期日独享这台计算机 12 小时。于是每周日从上午 9 点到晚上 9 点，我和另一名学生可以完全使用那台机器。我自学了计算机科学，并构建了人工智能程序。

Carrie Dolan：真的是自学？没有人教你如何使用？

Rodney Brooks：从书上学的。

Carrie Dolan：那你在周日的那些时间里做什么？写程序吗？

Rodney Brooks：我写了一整门 AI 语言。我构建的最好的程序是一个能做符号积分的程序——不是数值积分，而是输入公式后进行符号化积分推导。由于只有 16 KB 内存，我不得不实现虚拟内存（virtual memory）才能有足够空间工作。

通往机器人的道路

Carrie Dolan：那么你后来来到美国——是本科毕业后直接来的吗？

Rodney Brooks：我在澳大利亚完成了一个研究型硕士学位，主题是机器学习，但当时澳大利亚还没有这个方向。我是在书上读到它的。说实话那是一篇很糟糕的硕士论文，糟透了——一位评审说应该让我挂掉，另一位说应该通过，幸运的是我过了。但我知道我必须去别的地方。于是狂妄地申请了美国最顶尖的地方，恰好被斯坦福录取了——那是 1977 年。我常跟人说我很幸运，因为到了 1979 年前后人们才意识到计算机科学的重要，到那时我就进不去了。

Carrie Dolan：那么从斯坦福的计算机科学博士到 MIT 的机器人学教授，中间经历了什么？

Rodney Brooks：在斯坦福时，我是一位叫 Hans Moravec 的研究生的助手——人们可能听说过莫拉维克悖论（Moravec paradox）：移动和抓取是困难的，但智力活动在构建 AI 系统时相对容易。我是他的办公室室友。他有一台机器人，试图让它穿过一间 60 英尺长的房间。每天深夜其他人回家后，大型机负载降低时，我帮他部署，然后他的机器人每 15 分钟大约移动 1 码。如果运气好，到早上 6 点它能到达房间另一端。那是一台四轮的装置，就像一张放在轮子上的牌桌。

我的博士论文做的是纯机器视觉——分析卫星图像、尝试解读图像内容。顺便提一句，以展示当年条件之不同：在整个博士期间，我只处理了三张图像，三帧。仅此而已。在大型机上处理每张图像需要数周。总之，我于 1981 年以博士后身份加入 MIT，进入一个机器人研究组。

Carrie Dolan：是因为你的办公室室友让你对机器人产生了兴趣？

Rodney Brooks：是的。然后我开始从事机器人研究，先后在 MIT 和斯坦福任教。

创业与 Roomba

Carrie Dolan：在此过程中你也成为了创业者，联合创办了多家公司。

Rodney Brooks：是的。当我还在斯坦福任教时——就在我要离开的时候——我们一群人创办了一家 AI 软件公司，产品运行在最早的 Sun 工作站上。那家公司持续了大约 8 年，做的是专家系统（expert system）软件。人们可能不记得了，在上世纪 80 年代，专家系统曾是风靡一时的事物，被认为将接管世界。

Carrie Dolan：但似乎没有完全如愿。

Rodney Brooks：它们仍然存在，但只是作为组件，而非如当时人们所想象的无所不能。这是一个很好的教训——因为一波又一波的技术被预言将无所不能，而我们不可避免地在每一波浪潮过后发现，除了”当下最热门的事物”之外，还需要很多东西。

蚂蚁的启发

Carrie Dolan：Forbes 提到你受蚂蚁启发，然后创造了 Roomba。这之间的关联是什么？

Rodney Brooks：我那时在泰国一个非常偏远的地区，因为我娶了一位来自澳大利亚的泰裔同学，我们有了孩子后一起待在她长大的地方。周围的人基本都说泰语，而我泰语不太好。于是我就经常坐着观察昆虫的活动——蚂蚁和蝎子让我着迷。然后我意识到，它们在做许多事情上远胜于我们当时的大型移动机器人。它们体型微小，没有 10 万个神经元。相比之下，我们试图用大型计算机驱动物体移动。它们觅食、躲藏、进入洞穴，做各种各样的事情。这让我思考：”好吧，我必须重新思考智能的组织方式。”这使我开始探究所有动物都具备的底层基础能力——对于我们人类或其他小型动物来说，智能是建立在这些底层能力之上的。但那底下的东西究竟是什么？我接下来数年就在做这件事，而 Roomba 的控制方式正是从这项研究中产生的。

Roomba 的传感器与真实世界的挑战

Carrie Dolan：Roomba 有传感器，告诉它”撞墙了”或”该往哪里走”，对吧？

Rodney Brooks：有一整套传感器。第一版中有朝下的红外传感器、触觉传感器。我们还必须监测前方，因为绝不能让 Roomba 从楼梯上掉下去——那是一件重物砸下楼。我们用了三重冗余（triply redundant）系统，其中一套甚至不经过板载微处理器。多种传感器协同工作以了解周围环境。

最初的 Roomba 只是随机游走。它们碰到物体后改变方向。但如果检测到灰尘，我们会让它们原地打转——通过气流通道中颗粒碰撞产生的”颠簸感”来判断是否有灰尘。我们在一个高的厂房里搭建了一个模拟公寓来测试各个房间。但真实人家的床底下积了很多灰尘。当 Roomba 开进床底，看到灰尘就停下转圈，转了一圈又一圈，直到电池耗尽或尘盒填满——然后它就停在原地，而它在床底中间，没人够得着它。

所以我们必须做一些改进。我们也把尘盒容量增大了三倍。在我们的模拟公寓里我们一直在打扫，完全低估了有些地方的积尘量。

Carrie Dolan：这正是 Roomba 的好处——能钻进普通吸尘器钻不进去的床底。而且厨房柜子下面有个踢脚板空间（kick space），Roomba 也必须进得去，所以高度就不能太高。

iRobot 的创办与 Roomba 的上市

Carrie Dolan：你是和 MIT 的几个人一起创办 iRobot 的？

Rodney Brooks：是的，和我两位学生 Colin Angle 和 Helen Greiner。

Roomba 是在公司成立 12 年之后才推出的。在那之前我们做了很多其他项目。Roomba 于 2002 年上市。

Carrie Dolan：你现在已经不再参与这家公司了？

Rodney Brooks：不参与了，我在 2011 年退出了董事会。后来亚马逊曾想以很可观的价格收购，但反垄断（anti-trust）等顾虑出现了。不过我不再参与，所以不了解那些细节。

Robust AI：仓库自动化

Carrie Dolan：你后来又创办了多家机器人公司。你现在做的是 Robust AI？

Rodney Brooks：对，Robust AI。我们制造智能手推车——听起来极其无聊，但极其重要。

在 COVID 疫情期间，我们加速了在线购物习惯——每天收到的那些包裹是在履约中心（fulfillment center）里由人员将商品装入箱子的。商品从哪里来？从货架上取。亚马逊在 2000 年代收购了一家波士顿的 Kiva 公司，那里的机器人把整架货架运到拣选员面前。但这仅占所有仓库的极小一部分。绝大多数仓库中，人工拣选员推着手推车出去，将货物拣入车上的不同箱子，然后推着沉重的手推车到达包装区。这些工人每天行走 超过 30,000 步——这对身体是极大的负担。而且存在严重的劳动力短缺问题，人们普遍不愿长期从事这项工作。

我们的机器人可以大幅减少工人步数。手推车装满后自动离开——它知道所有拣选任务已完成。你从机场起飞时看到的那些扁平的建筑物、停着很多卡车的——那些全是履约中心，通常达百万平方英尺。你可以在任何方向上走一千英尺，而这正是你需要推车做的事。现在机器人代劳了。此外，机器人还会引领工人——它知道货物在哪里，亮起箭头指示位置。工人取下货物、扫描，然后机器人亮起指示灯显示该放入哪个箱子。与之对比，目前普遍的做法是：工人面对一块小小的绿色屏幕——仿佛模拟着 80 年代的固定尺寸终端——需要读出 10 位代码进行匹配，才能确定该取什么零件。

我们花了 7 年才走到这一步。人们总是低估硬件真正可运营所需的时长。这是我们第一阶段的产品。我们以服务形式（机器人即服务）销售。全球最大的第三方物流运营商是 DHL 供应链，这也是我们最大的客户，同时我们也在与许多其他客户合作。美国大概有 10 家主要的运营商。

Carrie Dolan：有竞争对手吗？

Rodney Brooks：有其他公司。不过我们当然相信我们做得更好，因为我们起步更晚，能够利用深度学习革命带来的 GPU 的馈赠。我几乎认为 NVIDIA 是世界上最幸运的公司——他们开发了图形处理单元（GPU）用于加速游戏，结果发现这些芯片在神经网络计算上也极为出色。于是人人都在追逐更多 GPU。更早进入这个领域的公司没有 GPU 可用，只能使用不同的技术。而我们使用 GPU，可以每隔几个月就更新模型，持续大幅改进。

对人形机器人的质疑

Carrie Dolan：现在有一股人形机器人（humanoid robot）热潮——Tesla 在做，Figure AI 在做，还有一堆其他公司。你曾公开表达对这股潮流的怀疑。能谈谈原因吗？

Rodney Brooks：先补充一个数据：中国有 140 家人形机器人公司。我对此持怀疑态度。

我在 MIT 时，iRobot 独立出去后，我不想让我的研究生觉得他们在为我的公司做事，于是我在 1992 年转向——开始打造人形机器人，这是美国最早的人形机器人研究。我们造了一系列大约 7 个人形机器人，第一个叫 Cog（类似齿轮和认知的含义）。2010 年我离开 MIT 后，创办了一家人形机器人公司，制造了约 4,000 个人形机器人在新罕布什尔州和马萨诸塞州生产。我们最大的市场其实是在中国——用在工厂里。它们没有腿，只有上半身，但有很长的双臂（因为没有髋关节——人类够东西时大量使用髋关节），且具备力敏感能力。任何人都可以在任何时候抓住机器人的手臂并将其移开。我测试安全性的方式是——每个人都知道——把头伸过去让机器人撞。大家因此知道我对待安全问题是认真的。这必须安全。

关于当前的人形机器人：我去年十月写了一篇两万词的长文，论述我认为为什么当前的人形机器人不会学会灵巧操作。核心原因是：它们大多基于观察人类动作进行模仿学习，但关键不在于运动轨迹本身——运动轨迹是由人体感受到的力决定的。而许多公司恰恰忽略了力觉与触觉。我们的手上有 18 族触觉神经元（18 families of touch neurons），我们感知力。如果没有这些，我认为我们不可能获得接近人类的灵巧性。存在经典的实验：仅仅麻醉人的指尖，然后让他们完成一个 10 秒前还能轻松完成的任务——他们就做不到了。我们甚至没有意识到所有这些神经元是如何赋能于我们双手的。

好消息是，一批小公司正在组建，专攻机器人手上的力传感和触觉传感。他们都来找我说”你愿意做顾问吗？”所以我现在为其中几家提供咨询服务。

Carrie Dolan：所以你说现有的人形机器人缺乏的东西，现在有公司在做了。

Rodney Brooks：是的。公平地说，学术界一直有很多人在做这方面的研究。但现在有了 VC 说：”也许我该投资其中一家公司。”以前这只是学术界遥远角落里无人兴奋的领域。

关于人形机器人的演示视频：如果你知道要看什么，你会发现很多视频玩了花招。例如清空洗碗机的视频——你看，洗碗机里只有四个盘子；机器人移动得很慢；而且它不是在放下盘子直到表面接触——它在接触之前就把盘子丢下来了，因为表面接触意味着力交互，而它们无法处理力。所以有一整类的人形机器人视频，懂行的人能看穿其中的技法。我并不是说他们在故意误导——某种程度上他们自己也相信。”看，我能让它跑起来了”——但这并不是按照人类工作方式在运行。

在制造或任何场景中，人们都希望动作快。而且机器人面对的不是人——它在与物理学对话。而物理学不会迁就你。物理学不会说”哦这只是一台机器人，我区别对待一下”。没有容错空间。

美国创新体系

Carrie Dolan：你入选了 Forbes “美国 250 位最伟大的创新者”榜单，与合众国 250 周年纪念相关。你在这个国家已经住了很长时间，你怎么看美国制度在你所经历的时期内促进创新的作用？以及美国要为下一个 250 年的伟大创新做些什么？

Rodney Brooks：第二个问题更难回答。我可以回溯过去，告诉你什么曾经有效、且仍在有效。

这真正起步于二战之后。战争期间大量大学投入到各类研究项目——机载雷达、核武器等。最高层做出了一个决定：由美国政府向研究型大学提供资金。一直有人抱怨这不公平——别的机构拿不到这些钱。但卓越中心（center of excellence）被强力推动。于是在漫长时间里产生了海量成果。这需要很多很多失败的路径——你必须接受这点，因为你不知道哪些会成功。

深度学习（deep learning）就是一个例子——它于 2012 年真正爆发，但基础技术是 Bernie Widrow 于 1960 年在斯坦福开发的。Widrow 去年去世了。此后经历了六代迭代，每一代结束时大家都说”它还是不行，还是不行，还是不行”——最终它成功了。所以你永远不知道。必须持续走下去。

不幸的是，现在正在发生的趋势是：因为大型语言模型表现惊人——语言能力完全出乎意料地好——政府资金正在从许多其他方向转向全力押注 AI 和量子计算。其他领域正在被抛在后面。即使是计算机科学中不属于 AI 的领域也在被忽视。那些原已接近突破的 AI 技术现在将无法获得资金。世界变了，而且变化在最近一年半中异常剧烈迅速。

我一直告诉人们，世界不断变化，我们必须适应。但我不确定风险投资的资金是否有长期耐心。我确信当前风投圈热捧的很多东西会戏剧性地失败——因为它们甚至还没经过实验室验证。如果没有实验室级别的验证，成功的概率大约是十分之一能走远一点，百分之一走得更远，千分之一能真正走远。但没有足够的风投资金来下所有这些赌注。VC 投的项目应该比大学基础研究走得更远，但这并不是现在正在发生的事。我不是在贬低风投——他们有自己试图运行的模式——但我认为这个系统出了点问题。比一点点问题更严重。

现在该回到过去吗？我不知道。我们从来没有真正回到过从前。我们不断变化。鸡蛋碎了，我们无法复原。我们该换新鸡蛋吗？我不确定。

HP 车库里的这一张沙发上——这里曾用电子管（vacuum tubes）做收音机，然后 Hewlett-Packard 转向制造音频振荡器，进而发展出测试设备。从那里走向了现代电子学。没有现代电子学就没有硅芯片电子学，就没有计算机，就没有今天的一切。那些人在做的事情在当时看来就是”为什么不多造几台收音机呢？”他们说：”不，我们要做不一样的事情。”你永远不知道未来会走向何方。

原文：Forbes — How Ants Inspired This Founder To Build A Robotic Vacuum Cleaner
受访者：Rodney Brooks（Rodney Brooks on Wikipedia）