DEV Community

cognitalk
cognitalk

Posted on

硅谷101访谈RSI田渊栋


一、 离开 Meta 与选择新公司 (00:00 - 05:45)

  • [ 00:06] 主持人:今天来到旧金山城里。嘉宾是老朋友田渊栋,作为 Meta FAIR 前研究总监,历经半年后官宣新动向:与其它七位顶级研究员创立了新 AI 公司 Recursive Superintelligence(简称 RSI),融资 6.5 亿美元,估值 46.5 亿美元。过去半年 AI 格局变化迅速,为什么资本在没有任何产品的前提下如此买账?
  • [05:43] 田渊栋:最顶级的资本还是看人。其实半年前接受采访时已经差不多定下来了,这是一个比较快速的决定过程。当时手机基本处于被打爆的状态,信息多到根本回不过来。
  • [03:49] 田渊栋:最后选择 RSI 的原因,是因为现在大趋势正在走向团队小型化、速度变快、内部摩擦变少。这种“很小很清”的团队把事情做成,已经成了大趋势。如果再在大公司里待着,可能就不太适合了。
  • [04:12] 田渊栋:我目睹过很多大团队的问题。当时 Anthropic、xAI、亚马逊、苹果、微软都来找过我。但两三个月之后,当时找我的很多高管自己都离职了。大公司组织架构比较重、人太多,CEO 非常急切希望成功,会下达很多命令指示,大团队要花大量时间去适应上面的要求、对齐下面员工的想法。组织沟通的速度,已经根本跟不上 AI 的发展速度。所以大厂频繁进行重组(Relog)和裁员。我在 Meta 待了快 11 年,对这种痛点有切身的体会。
  • [06:47] 田渊栋:其它初创团队找我,很多是希望招核心员工,或者让我去做 Head of AI、Head of Research。但对我来说,如果去创业,我更希望以联合创始人(Co-founder)的身份加入。

二、 黄金创始人团队的背景 (05:45 - 14:03)

  • [07:49] 田渊栋:RSI 有 8 个 Co-founder。我们的 CEO 是 Richard Socher,他以前创立了 MetaMind 被 Salesforce 收购,在 Salesforce 做了四年首席科学家(Chief Scientist),之后出来开了搜索引擎 u.com,现在依然盈利且发展不错。
  • [08:11] 田渊栋:另外还有蔡明雄(Mingxiong Cai),他之前跟 Richard 一起做 MetaMind,被收购后在 Salesforce Research 待了十多年,担任 Senior VP。
  • [08:31] 田渊栋:还有 Tim Rocktäschel,他以前是我在 FAIR 的同事,后来去 UCL 做教授。以及 JF Chrome,他们团队在 Agent 领域深耕了十年,近期关于 AI Scientist V2 的文章已经被 Nature 杂志接收了。在这个方向上,他的学术影响力和技术积累是非常深厚的。

三、 核心路线:递归自我改进与 AI 自动化科研 (14:03 - 19:38)

  • [15:41] 主持人:目前像 Google 等前沿大模型的主流做法,依然是依靠人类去设计模型结构、收集数据、大规模训练以及人工标注对齐(RLHF)。你认为在这条路上,人类正在成为瓶颈。你们押注的是“递归自我改进(Recursive Self-Improvement)”,让 AI 自动化研发过程,这怎么实现?
  • [16:04] 田渊栋:现在的 AI 研发高度依赖研究员(人类)。但如果我们的终极目标是 AGI(设定为 10),其实现在整个行业大概只走到了 1 到 2 的位置。
  • [16:30] 田渊栋:既然整个人类科学研究的过程本身是可以被建模的,那我们为什么不把目标放得更长远一点?我们第一步要做的就是自动化 AI 科研。利用 AI 来优化 AI 自身的东西,让模型自己去改代码、去寻找新的规律、甚至设计并完成出一系列人类想不到的科学实验。通过 AI 产生新的底层科学发现,从而增加整个世界技术进步的速度。

四、 递归演进中的可解释性与安全 (19:38 - 22:50)

  • [19:38] 主持人:当 AI 开始自己修改自己的代碼或权重、自己设计实验时,代码和模型的“可解释性(Interpretability)”会不会变得更加困难?
  • [20:09] 田渊栋:这非常重要,甚至比原先更重要了。一方面是出于安全(Safety)的考虑,我们在做递归自我演进的时候,核心前提是要做“安全的超级智能(Safe Superintelligence)”。
  • [20:26] 田渊栋:如果你对模型的内部机制有深刻的了解,当模型发生越界,或者在某些地方崩溃(Collapse)时,我们才能通过可解释性去理解它为什么失败、为什么做恶。我们甚至可以用另外一个模型去作为裁判,实时验证和监督这个模型是不是好的。

五、 “语言不是思考的本体”与 Coconut 范式 (22:50 - 31:54)

  • [25:32] 田渊栋:谈到世界模型,我认为语言(Language)跟视觉相比,语言依然是一个更有信号、更具备离散符号特征的东西。
  • [25:40] 田渊栋:很多人现在关注像 Coconut 这类新的推理路线——它表明“语言并不是思考的本体”。现在有一些最前沿的路线在尝试把 Diffusion(扩散模型)的连续潜空间(Latent Space)与大语言模型(LLM)的动态组合在一起。当 AI 思考的迭代速度和并行度真正上来的那一刻,它的进化肯定会变得更快。
  • [29:22] 田渊栋:另外在能力提升上,有预训练(Pre-training)和强化学习(RL)两条路。我的一个观点是:预训练的上限,其实决定了强化学习的上限。如果你的 base 模型对世界的认知和常识不够,RL 在后面很难凭空探索出高维的复杂泛化能力。当然,这也是我个人的观点,也可能是错的(笑)。

五.一、 商业化规划与为什么是“现在” (31:54 - 42:36)

1. RSI 的研发路线与商业化思考

  • 第一步押注自动化科研(AI for Research): RSI 并没有像传统大厂那样一上来就拼通用商业应用,而是将“让 AI 自动化搞科研”作为第一步。田渊栋认为,如果能够把科学研究的过程(包括提出猜想、设计实验、修改代码、分析数据)本身进行建模,AI 就能自己演进并产生极大的生产力放大效应。
  • 从研究到商业化的闭环: 当 AI 能够加速代码编写和实验迭代时,团队的整体研发速度会呈指数级提升。这种高效的底层科研模型不仅能自我改进,还能沉淀出极强的通用推理和问题解决能力,进而向外部垂直领域释放商业价值。

2. 为什么现在是做 RSI 的最好时机?

  • 大厂沟通与组织架构失灵: 田渊栋提到大公司(如 Meta、Anthropic、xAI 等)由于团队急剧膨胀,CEO 往往非常焦虑且频繁调整战略,导致基层工程师需要花费大量时间进行组织层面的“对齐(Alignment)”,沟通成本极高、内耗严重。
  • 小团队(Neo-labs)的效率神话: 当前大模型技术(如 DeepSeek 等)证明了精简且顶级的团队完全有能力打破资源垄断。在快速迭代的 AI 时代,小型精英实验室的灵活性、低沟通摩擦和极快的决策速度,能产生远超传统大厂的组织效率。

五.二、 下一代 AI 实验室生态:SSI、AMI Labs 与 Ineffable (42:36 - 50:42)

田渊栋在访谈中对硅谷当前涌现的几个顶级明星 Neo-lab 进行了横向盘点与深度对比:

实验室名称 核心代表人物 愿景与路线特征
SSI (Safe Superintelligence) Ilya Sutskever 极度专注于安全、可控的超智能(Safe AGI),走的是非常纯粹、甚至带有一点理想主义的封闭研究路线,不急于产品化。
AMI Labs - 聚焦于高级推理与智能体(Agents)的垂直突破,试图在特定高价值场景中建立技术壁垒。
Ineffable Intelligence - 探索非传统、可能无法用言语直接表达的(Ineffable)底层表征与推理机制,寻找语言之外的思考新范式。
RSI (Recursive Superintelligence) 田渊栋、Richard Socher 等 核心在于递归自我改进(Recursive Self-Improvement),通过让 AI 像人类科学家一样去“研究 AI”并自发进化,用组织效率和技术自进化对抗大厂的算力怪兽。

五.三、 预训练 VS 强化学习:能力提升的两条路径 (50:42 - 52:35)

田渊栋就当前前沿模型能力的跃升,给出了一个非常关键的技术洞察:

  • 预训练(Pre-training)决定上限: 田渊栋明确指出,“预训练的上限,其实决定了强化学习(RL)的上限”。如果底座模型在预训练阶段没有对世界规律产生足够的“顿悟(Grokking)”和泛化表征能力,后期的强化学习再怎么对齐、怎么刷题,也只是在“死记硬背”或进行局部优化,很难产生质的突破。
  • 两条路径的协作: 预训练负责扩充模型的知识边界和潜在认知空间;强化学习则负责通过搜索、推理和奖励机制(Reward Models),将这些沉淀在底座中的隐性能力最大化地激发和对齐出来。两者是地基与建筑的关系。

五.四、 数据还能怎么走:合成数据与持续学习 (52:35 - 01:01:10)

  • 高质量公网数据的枯竭: 硅谷公认的高质量人类文本数据红利基本快被挖干了。单纯靠堆砌更多的公网语料已经无法带来模型性能的线性提升。
  • 合成数据(Synthetic Data)的挑战: 用 AI 生成数据来训练 AI 是必然趋势,但田渊栋强调,盲目的合成数据会导致模型陷入“幻觉自我放大”或“模式坍塌”。关键在于如何利用形式化验证(如数学证明 Lean、代码编译器)或高强度的多模态物理世界反馈,来对合成数据进行严格的质量过滤与交叉验证。
  • 持续学习(Continuous Learning)的破局: 模型需要摆脱每隔几个月就重新全量预训练的传统范式,必须实现“在与环境、用户的互动中进行不遗忘旧知识的增量持续学习”,这也是解决数据瓶颈和实现 AGI 的必经之路。

五.五、 前沿大模型乱斗、组织架构与人才争夺 (01:01:10 - 01:18:38)

  • 人才争夺战: RSI 目前大约 25 人(伦敦和旧金山各一部分)。田渊栋提到,他们现在倾向于招募那些不仅懂算法、更能手撕底层工程,同时对未知路线有极强好奇心的“全能型研究员”。
  • xAI 与大模型大战的本质: 提及马斯克的 xAI 等对手时,田渊栋一针见血地指出,现在前沿大模型的比拼,表面上是算力和模型的对决,本质上已经变成了组织架构与管理效率的战争。谁的架构能减少内耗、让科学家和工程师的产出效率最大化,谁就能在这场千亿美金的消耗战中率先跑出新范式。

六、 职场“蒸馏”与普通人的当代生存法则 (01:18:38 - 01:29:28)

  • [01:18:38] 主持人:现在很多大厂工程师在面临巨大的压力,包括 Meta 之前关于强制“蒸馏”员工(将员工经验沉淀给 AI 后进行人员优化)的争议。AI 正在给就业市场带来巨大的冲击,大家都在担心自己变成被淘汰的螺丝钉。你怎么看现在的职业变化?
  • [01:19:10] 田渊栋:大模型和 AI Coding 的成熟,带来了一个很大的趋势:它相当于“吸心大法”。它能够快速处理大公司里最让人头疼的信息分散、文档不齐、代码太杂的问题,并直接给出对的 Context 和判断。这样一来,企业对于普通的、从事纯执行和传统代码打杂的 4 级、5 级工程师的需求量确实在急剧变少。
  • [01:20:00] 田渊栋:我有一个形象的比喻:现在的职场,就像是“一条鱼在一个逐渐干涸的水坑里跳跃”。你总想着从大厂 A 跳到大厂 B,觉得能找到新的归宿。但从总体上来看,外面的“水”(即传统的就业岗位和红利空间)是越来越少的,你迟早会无处可跳。
  • [01:21:15] 田渊栋:在这种生存环境下,你最终一定要打破现有的线性技能思维,让自己变成一个“四维生物”,你才可能在水变少的未来世界里活下来。也就是说,你必须去寻找那些 AI 无法替代的、更高维度的全局组织能力、跨界洞察力或者长期的科学研究判断力(Research),找到自己独特的意义。

七、 组织效率大乱斗与 RSI 团队文化 (01:23:35 - 尾声)

  • [01:23:35] 田渊栋:当前像 OpenAI、Google、xAI 这种 Frontier Lab 的前沿大模型之争,打到最后,其实已经变成了一场组织架构之争。谁的组织架构更轻量、内部损耗更小、战略调整能在一两天内完成对齐,谁就能赢。组织效率在这次技术革命里扮演了极其巨大的角色。
  • [01:29:28] 田渊栋(带主持人参观办公室):我们大概两个多月前搬进旧金山城里的这个新办公室。目前整个团队有 25 个人左右,2/3 在旧金山,1/3 在伦敦。
  • [01:30:42] 田渊栋:我们这没有单独的老板办公室,大家都坐在外面大统间,我自己就坐在角落。我们的目的就是尽量不开会,有事情大家坐下来直接沟通、很快搞定,这和在大厂有非常大的区别。
  • [01:31:19] 主持人:之前和安德烈(Andrej Karpathy)聊的时候,他说有研究员强烈要求在办公室放桑拿房(笑)。你们这有什么?
  • [01:31:22] 田渊栋:我们这还没那么高级,不过有一个乒乓球桌可以思考、打两把。虽然现在索尼等公司的机器人打乒乓球已经很厉害了,但人类平时切磋交流还是挺好的。

完整视频可以在 YouTube 视频原地址 中观看。

Top comments (0)