这期 Bloomberg Technology 的特别节目《Humanoids: from Spectacle to Scale》带我们直击了在东京举办的人形机器人峰会(Humanoid Summit)。节目核心探讨了人形机器人如何从当初银幕或舞台上的“娱乐表演”走向真正的“规模化商业落地”。
整期视频内容非常丰富,主要由行业宏观概述以及三场重量级对话(谷歌、本田、彭博智库)组成,以下为您梳理的详细内容:
一、 宏观行业背景与市场预测 [00:15]
- 核心共识: 行业内的共识是“概念验证(PoC)阶段”已经结束,接下来的核心挑战是如何将机器人推向现实世界,并建立可扩展的商业模式。
- 市场规模预测:
- 目前(2026年前后)全球人形机器人市场规模仅约 20 亿至 30 亿美元 [01:00]。
巴克莱(Barclays)预测,到 2035 年将飙升至 400 亿美元;而到 2050 年(算上服务和供应链),潜在市场规模甚至可达 5 万亿美元 [01:10]。
首个大爆发场景: 制造业。由于全球劳动力短缺,加之 AI 让机器人能够理解和适应物理世界,它们正加速走向工厂。
现状差距: 2025 年全球人形机器人出货量仅 13,000 台(相比之下传统工业机器人年安装量超 50 万台)[02:05]。但到 2035 年,预计部署量将暴增至 1200 万台。
格局差异: 中国在产量和规模上处于领先地位,制造了目前全球绝大多数的人形机器人,且价格远低于西方同行 [02:23]。
二、 对话谷歌 DeepMind:具体落地的“具身智能” [02:51]
嘉宾是 Google DeepMind 机器人移动与视觉团队负责人 Carolina Parada。
- 为什么要选“人形”?
- 人类的日常环境(房屋、工厂)本就是为人类体型设计的,人形机器人能无缝融入。
从机器学习角度,人形机器人可以更直接地“模仿和学习”人类完成任务的动作 [03:38]。
Gemini 机器人架构(Gemini Robotics): 谷歌正努力将 Gemini 的多模态、世界理解和推理能力带入物理世界(具身智能)。目前他们已与 Boston Dynamics(波士顿动力) 合作,将 Gemini 植入新版商用 Atlas 机器人和四足机器人 Spot 中 [02:58]。
技术突破与演进:
以前机器人多是执行预设的、死板的硬编码动作。
谷歌引入了 VLA(Vision-Language-Action,视觉-语言-行动) 大模型,让机器人可以用自然语言理解环境并转化为通用行为。
目前依靠强化学习和模拟训练,机器人已经能实现非常复杂的全身控制(如特技动作),甚至能通过模仿学习完成“系鞋带”这样高灵巧度的动作 [06:43]。
目前的瓶颈: 极高灵巧度的任务(如折纸、装便当盒)依然是当前的攻坚前沿 [04:53]。
安全框架: 谷歌采用多层安全机制,包括功能安全(系统故障处理)、控制安全(防摔、防撞)以及语义物理安全(让机器人拥有“常识”,比如走路绕开水坑、不把物品放得太靠边缘) [07:34]。
三、 对话本田(Honda)Frontier Robotics:从走路到“手部灵巧度” [09:42]
嘉宾是本田研发中心前沿机器人执行总工程师 Takahide Yoshi(吉池崇由)(曾参与大名鼎鼎的 ASIMO 机器人开发)。
- 研究重心的转移: 本田过去几十年专注于机器人的“双足行走”(从 P2 到 ASIMO)。但在 2013 年左右,本田将重心从双足行走转移到了更高难度的移动(如爬梯子、灾后救援),并最终聚焦于“机械手操纵(Manipulation)”,因为只有手部操纵才能直接为客户创造价值 [10:32]。
- 化身机器人(Avatar Robot)愿景: 本田将其定义为“四维移动空间”(超越时间和距离)。他们希望机器人既能被远程操作(Teleoperation),又能具备自主性(Autonomy),而连接两者的最佳人类交互界面就是多指机械手 [11:48]。
- 硬件与计算红利: 过去开发 ASIMO 时 CPU 算力很低。现在计算资源极其充裕,让机器人走、跑变得简单得多,甚至非机器人博士也能让机器人动起来 [12:46]。
- 全球竞争格局分析:
- 中国科技公司: 优势在于强悍的成本削减与供应链控价能力。
- 美国公司: 在 AI 算法与软件上具有极强的领先优势。
- 日本公司: 强在制造高精度、高品质的硬件。
- 吉池认为,日本公司的出路在于发挥精密硬件优势的同时,深度结合 AI 技术 [15:45]。
四、 对话彭博智库(Bloomberg Intelligence):商业化瓶颈与文化差异 [16:57]
嘉宾是彭博智库分析师 Ian Maya。
- 商业模式的现状: 行业目前正处于分水岭。少数领头羊企业已经开始通过人形机器人业务变现并盈利,但绝大多数企业仍处于严重亏损状态 [18:36]。
- 像手机一样分级: 预测未来人形机器人会像智能手机一样走向分级——既有低端、低门槛、只能跳跳舞的娱乐机器人,也有高端、高规格、能处理复杂工业或家庭繁杂事务的“溢价级”机器人 [19:33]。
- 文化接受度的巨大差异: 根据三菱综合研究所的一项调查显示,56% 的中国受访者愿意在日常生活中引入人形机器人,而美国和日本的接受意愿则明显低得多。文化层面的接受度将成为技术普及的巨大分水岭 [20:08]。
- 地缘政治风险: 许多人形机器人高度依赖特定的 AI 模型和媒体技术。如果贸易摩擦再次升级,许多中国人形机器人企业可能不得不寻找本土替代框架来维持发展 [20:44]。
- 两大安全隐患: 目前行业缺乏统一的安全标准。除了物理安全(与人共存不伤人)外,网络安全(Cybersecurity)是极大的隐患,因为许多机器人支持远程控制,一旦被黑客入侵,后果不堪设想 [21:13]。
总结
纵观整期节目,行业正处在“有了聪明的 AI 大脑,但硬件成本、手部灵巧度及安全标准还在补课”的阶段。大家都觉得人形机器人的“ChatGPT时刻”虽然还没真正到来,但在中美日各具优势的催化下,它正在以超出想象的速度逼近。
Top comments (0)