cognitalk

Posted on Jun 6 • Edited on Jun 8

硅谷101访谈RSI田渊栋

#ai #podcast #algorithms #rsi

https://www.youtube.com/watch?v=F7oNfszczVc

一、离开 Meta 与选择新公司 (00:00 - 05:45)

[ 00:06] 主持人：今天来到旧金山城里。嘉宾是老朋友田渊栋，作为 Meta FAIR 前研究总监，历经半年后官宣新动向：与其它七位顶级研究员创立了新 AI 公司 Recursive Superintelligence（简称 RSI），融资 6.5 亿美元，估值 46.5 亿美元。过去半年 AI 格局变化迅速，为什么资本在没有任何产品的前提下如此买账？
[05:43] 田渊栋：最顶级的资本还是看人。其实半年前接受采访时已经差不多定下来了，这是一个比较快速的决定过程。当时手机基本处于被打爆的状态，信息多到根本回不过来。
[03:49] 田渊栋：最后选择 RSI 的原因，是因为现在大趋势正在走向团队小型化、速度变快、内部摩擦变少。这种“很小很清”的团队把事情做成，已经成了大趋势。如果再在大公司里待着，可能就不太适合了。
[04:12] 田渊栋：我目睹过很多大团队的问题。当时 Anthropic、xAI、亚马逊、苹果、微软都来找过我。但两三个月之后，当时找我的很多高管自己都离职了。大公司组织架构比较重、人太多，CEO 非常急切希望成功，会下达很多命令指示，大团队要花大量时间去适应上面的要求、对齐下面员工的想法。组织沟通的速度，已经根本跟不上 AI 的发展速度。所以大厂频繁进行重组（Relog）和裁员。我在 Meta 待了快 11 年，对这种痛点有切身的体会。
[06:47] 田渊栋：其它初创团队找我，很多是希望招核心员工，或者让我去做 Head of AI、Head of Research。但对我来说，如果去创业，我更希望以联合创始人（Co-founder）的身份加入。

二、黄金创始人团队的背景 (05:45 - 14:03)

[07:49] 田渊栋：RSI 有 8 个 Co-founder。我们的 CEO 是 Richard Socher，他以前创立了 MetaMind 被 Salesforce 收购，在 Salesforce 做了四年首席科学家（Chief Scientist），之后出来开了搜索引擎 u.com，现在依然盈利且发展不错。
[08:11] 田渊栋：另外还有蔡明雄（Mingxiong Cai），他之前跟 Richard 一起做 MetaMind，被收购后在 Salesforce Research 待了十多年，担任 Senior VP。
[08:31] 田渊栋：还有 Tim Rocktäschel，他以前是我在 FAIR 的同事，后来去 UCL 做教授。以及 JF Chrome，他们团队在 Agent 领域深耕了十年，近期关于 AI Scientist V2 的文章已经被 Nature 杂志接收了。在这个方向上，他的学术影响力和技术积累是非常深厚的。

三、核心路线：递归自我改进与 AI 自动化科研 (14:03 - 19:38)

[15:41] 主持人：目前像 Google 等前沿大模型的主流做法，依然是依靠人类去设计模型结构、收集数据、大规模训练以及人工标注对齐（RLHF）。你认为在这条路上，人类正在成为瓶颈。你们押注的是“递归自我改进（Recursive Self-Improvement）”，让 AI 自动化研发过程，这怎么实现？
[16:04] 田渊栋：现在的 AI 研发高度依赖研究员（人类）。但如果我们的终极目标是 AGI（设定为 10），其实现在整个行业大概只走到了 1 到 2 的位置。
[16:30] 田渊栋：既然整个人类科学研究的过程本身是可以被建模的，那我们为什么不把目标放得更长远一点？我们第一步要做的就是自动化 AI 科研。利用 AI 来优化 AI 自身的东西，让模型自己去改代码、去寻找新的规律、甚至设计并完成出一系列人类想不到的科学实验。通过 AI 产生新的底层科学发现，从而增加整个世界技术进步的速度。

四、递归演进中的可解释性与安全 (19:38 - 22:50)

[19:38] 主持人：当 AI 开始自己修改自己的代碼或权重、自己设计实验时，代码和模型的“可解释性（Interpretability）”会不会变得更加困难？
[20:09] 田渊栋：这非常重要，甚至比原先更重要了。一方面是出于安全（Safety）的考虑，我们在做递归自我演进的时候，核心前提是要做“安全的超级智能（Safe Superintelligence）”。
[20:26] 田渊栋：如果你对模型的内部机制有深刻的了解，当模型发生越界，或者在某些地方崩溃（Collapse）时，我们才能通过可解释性去理解它为什么失败、为什么做恶。我们甚至可以用另外一个模型去作为裁判，实时验证和监督这个模型是不是好的。

五、 “语言不是思考的本体”与 Coconut 范式 (22:50 - 31:54)

[25:32] 田渊栋：谈到世界模型，我认为语言（Language）跟视觉相比，语言依然是一个更有信号、更具备离散符号特征的东西。
[25:40] 田渊栋：很多人现在关注像 Coconut 这类新的推理路线——它表明“语言并不是思考的本体”。现在有一些最前沿的路线在尝试把 Diffusion（扩散模型）的连续潜空间（Latent Space）与大语言模型（LLM）的动态组合在一起。当 AI 思考的迭代速度和并行度真正上来的那一刻，它的进化肯定会变得更快。
[29:22] 田渊栋：另外在能力提升上，有预训练（Pre-training）和强化学习（RL）两条路。我的一个观点是：预训练的上限，其实决定了强化学习的上限。如果你的 base 模型对世界的认知和常识不够，RL 在后面很难凭空探索出高维的复杂泛化能力。当然，这也是我个人的观点，也可能是错的（笑）。

五.一、商业化规划与为什么是“现在” (31:54 - 42:36)

1. RSI 的研发路线与商业化思考

第一步押注自动化科研（AI for Research）： RSI 并没有像传统大厂那样一上来就拼通用商业应用，而是将“让 AI 自动化搞科研”作为第一步。田渊栋认为，如果能够把科学研究的过程（包括提出猜想、设计实验、修改代码、分析数据）本身进行建模，AI 就能自己演进并产生极大的生产力放大效应。
从研究到商业化的闭环： 当 AI 能够加速代码编写和实验迭代时，团队的整体研发速度会呈指数级提升。这种高效的底层科研模型不仅能自我改进，还能沉淀出极强的通用推理和问题解决能力，进而向外部垂直领域释放商业价值。

2. 为什么现在是做 RSI 的最好时机？

大厂沟通与组织架构失灵： 田渊栋提到大公司（如 Meta、Anthropic、xAI 等）由于团队急剧膨胀，CEO 往往非常焦虑且频繁调整战略，导致基层工程师需要花费大量时间进行组织层面的“对齐（Alignment）”，沟通成本极高、内耗严重。
小团队（Neo-labs）的效率神话： 当前大模型技术（如 DeepSeek 等）证明了精简且顶级的团队完全有能力打破资源垄断。在快速迭代的 AI 时代，小型精英实验室的灵活性、低沟通摩擦和极快的决策速度，能产生远超传统大厂的组织效率。

五.二、下一代 AI 实验室生态：SSI、AMI Labs 与 Ineffable (42:36 - 50:42)

田渊栋在访谈中对硅谷当前涌现的几个顶级明星 Neo-lab 进行了横向盘点与深度对比：

实验室名称	核心代表人物	愿景与路线特征
SSI (Safe Superintelligence)	Ilya Sutskever	极度专注于安全、可控的超智能（Safe AGI），走的是非常纯粹、甚至带有一点理想主义的封闭研究路线，不急于产品化。
AMI Labs	-	聚焦于高级推理与智能体（Agents）的垂直突破，试图在特定高价值场景中建立技术壁垒。
Ineffable Intelligence	-	探索非传统、可能无法用言语直接表达的（Ineffable）底层表征与推理机制，寻找语言之外的思考新范式。
RSI (Recursive Superintelligence)	田渊栋、Richard Socher 等	核心在于递归自我改进（Recursive Self-Improvement），通过让 AI 像人类科学家一样去“研究 AI”并自发进化，用组织效率和技术自进化对抗大厂的算力怪兽。

五.三、预训练 VS 强化学习：能力提升的两条路径 (50:42 - 52:35)

田渊栋就当前前沿模型能力的跃升，给出了一个非常关键的技术洞察：

预训练（Pre-training）决定上限： 田渊栋明确指出，“预训练的上限，其实决定了强化学习（RL）的上限”。如果底座模型在预训练阶段没有对世界规律产生足够的“顿悟（Grokking）”和泛化表征能力，后期的强化学习再怎么对齐、怎么刷题，也只是在“死记硬背”或进行局部优化，很难产生质的突破。
两条路径的协作： 预训练负责扩充模型的知识边界和潜在认知空间；强化学习则负责通过搜索、推理和奖励机制（Reward Models），将这些沉淀在底座中的隐性能力最大化地激发和对齐出来。两者是地基与建筑的关系。

五.四、数据还能怎么走：合成数据与持续学习 (52:35 - 01:01:10)

高质量公网数据的枯竭： 硅谷公认的高质量人类文本数据红利基本快被挖干了。单纯靠堆砌更多的公网语料已经无法带来模型性能的线性提升。
合成数据（Synthetic Data）的挑战： 用 AI 生成数据来训练 AI 是必然趋势，但田渊栋强调，盲目的合成数据会导致模型陷入“幻觉自我放大”或“模式坍塌”。关键在于如何利用形式化验证（如数学证明 Lean、代码编译器）或高强度的多模态物理世界反馈，来对合成数据进行严格的质量过滤与交叉验证。
持续学习（Continuous Learning）的破局： 模型需要摆脱每隔几个月就重新全量预训练的传统范式，必须实现“在与环境、用户的互动中进行不遗忘旧知识的增量持续学习”，这也是解决数据瓶颈和实现 AGI 的必经之路。

五.五、前沿大模型乱斗、组织架构与人才争夺 (01:01:10 - 01:18:38)

人才争夺战： RSI 目前大约 25 人（伦敦和旧金山各一部分）。田渊栋提到，他们现在倾向于招募那些不仅懂算法、更能手撕底层工程，同时对未知路线有极强好奇心的“全能型研究员”。
xAI 与大模型大战的本质： 提及马斯克的 xAI 等对手时，田渊栋一针见血地指出，现在前沿大模型的比拼，表面上是算力和模型的对决，本质上已经变成了组织架构与管理效率的战争。谁的架构能减少内耗、让科学家和工程师的产出效率最大化，谁就能在这场千亿美金的消耗战中率先跑出新范式。

六、职场“蒸馏”与普通人的当代生存法则 (01:18:38 - 01:29:28)

[01:18:38] 主持人：现在很多大厂工程师在面临巨大的压力，包括 Meta 之前关于强制“蒸馏”员工（将员工经验沉淀给 AI 后进行人员优化）的争议。AI 正在给就业市场带来巨大的冲击，大家都在担心自己变成被淘汰的螺丝钉。你怎么看现在的职业变化？
[01:19:10] 田渊栋：大模型和 AI Coding 的成熟，带来了一个很大的趋势：它相当于“吸心大法”。它能够快速处理大公司里最让人头疼的信息分散、文档不齐、代码太杂的问题，并直接给出对的 Context 和判断。这样一来，企业对于普通的、从事纯执行和传统代码打杂的 4 级、5 级工程师的需求量确实在急剧变少。
[01:20:00] 田渊栋：我有一个形象的比喻：现在的职场，就像是“一条鱼在一个逐渐干涸的水坑里跳跃”。你总想着从大厂 A 跳到大厂 B，觉得能找到新的归宿。但从总体上来看，外面的“水”（即传统的就业岗位和红利空间）是越来越少的，你迟早会无处可跳。
[01:21:15] 田渊栋：在这种生存环境下，你最终一定要打破现有的线性技能思维，让自己变成一个“四维生物”，你才可能在水变少的未来世界里活下来。也就是说，你必须去寻找那些 AI 无法替代的、更高维度的全局组织能力、跨界洞察力或者长期的科学研究判断力（Research），找到自己独特的意义。

七、组织效率大乱斗与 RSI 团队文化 (01:23:35 - 尾声)

[01:23:35] 田渊栋：当前像 OpenAI、Google、xAI 这种 Frontier Lab 的前沿大模型之争，打到最后，其实已经变成了一场组织架构之争。谁的组织架构更轻量、内部损耗更小、战略调整能在一两天内完成对齐，谁就能赢。组织效率在这次技术革命里扮演了极其巨大的角色。
[01:29:28] 田渊栋（带主持人参观办公室）：我们大概两个多月前搬进旧金山城里的这个新办公室。目前整个团队有 25 个人左右，2/3 在旧金山，1/3 在伦敦。
[01:30:42] 田渊栋：我们这没有单独的老板办公室，大家都坐在外面大统间，我自己就坐在角落。我们的目的就是尽量不开会，有事情大家坐下来直接沟通、很快搞定，这和在大厂有非常大的区别。
[01:31:19] 主持人：之前和安德烈（Andrej Karpathy）聊的时候，他说有研究员强烈要求在办公室放桑拿房（笑）。你们这有什么？
[01:31:22] 田渊栋：我们这还没那么高级，不过有一个乒乓球桌可以思考、打两把。虽然现在索尼等公司的机器人打乒乓球已经很厉害了，但人类平时切磋交流还是挺好的。

完整视频可以在 YouTube 视频原地址中观看。

DEV Community

硅谷101访谈RSI田渊栋

一、离开 Meta 与选择新公司 (00:00 - 05:45)

二、黄金创始人团队的背景 (05:45 - 14:03)

三、核心路线：递归自我改进与 AI 自动化科研 (14:03 - 19:38)

四、递归演进中的可解释性与安全 (19:38 - 22:50)

五、 “语言不是思考的本体”与 Coconut 范式 (22:50 - 31:54)

五.一、商业化规划与为什么是“现在” (31:54 - 42:36)

1. RSI 的研发路线与商业化思考

2. 为什么现在是做 RSI 的最好时机？

五.二、下一代 AI 实验室生态：SSI、AMI Labs 与 Ineffable (42:36 - 50:42)

五.三、预训练 VS 强化学习：能力提升的两条路径 (50:42 - 52:35)

五.四、数据还能怎么走：合成数据与持续学习 (52:35 - 01:01:10)

五.五、前沿大模型乱斗、组织架构与人才争夺 (01:01:10 - 01:18:38)

六、职场“蒸馏”与普通人的当代生存法则 (01:18:38 - 01:29:28)

七、组织效率大乱斗与 RSI 团队文化 (01:23:35 - 尾声)

Top comments (0)

一、 离开 Meta 与选择新公司 (00:00 - 05:45)

二、 黄金创始人团队的背景 (05:45 - 14:03)

三、 核心路线：递归自我改进与 AI 自动化科研 (14:03 - 19:38)

四、 递归演进中的可解释性与安全 (19:38 - 22:50)

五、 “语言不是思考的本体”与 Coconut 范式 (22:50 - 31:54)

五.一、 商业化规划与为什么是“现在” (31:54 - 42:36)

1. RSI 的研发路线与商业化思考

2. 为什么现在是做 RSI 的最好时机？

五.二、 下一代 AI 实验室生态：SSI、AMI Labs 与 Ineffable (42:36 - 50:42)

五.三、 预训练 VS 强化学习：能力提升的两条路径 (50:42 - 52:35)

五.四、 数据还能怎么走：合成数据与持续学习 (52:35 - 01:01:10)

五.五、 前沿大模型乱斗、组织架构与人才争夺 (01:01:10 - 01:18:38)

六、 职场“蒸馏”与普通人的当代生存法则 (01:18:38 - 01:29:28)

七、 组织效率大乱斗与 RSI 团队文化 (01:23:35 - 尾声)

一、离开 Meta 与选择新公司 (00:00 - 05:45)

二、黄金创始人团队的背景 (05:45 - 14:03)

三、核心路线：递归自我改进与 AI 自动化科研 (14:03 - 19:38)

四、递归演进中的可解释性与安全 (19:38 - 22:50)

五.一、商业化规划与为什么是“现在” (31:54 - 42:36)

五.二、下一代 AI 实验室生态：SSI、AMI Labs 与 Ineffable (42:36 - 50:42)

五.三、预训练 VS 强化学习：能力提升的两条路径 (50:42 - 52:35)

五.四、数据还能怎么走：合成数据与持续学习 (52:35 - 01:01:10)

五.五、前沿大模型乱斗、组织架构与人才争夺 (01:01:10 - 01:18:38)

六、职场“蒸馏”与普通人的当代生存法则 (01:18:38 - 01:29:28)

七、组织效率大乱斗与 RSI 团队文化 (01:23:35 - 尾声)