François Chollet 谈 AGI 未来

#ai #programming #architecture #algorithms

原播客链接：https://www.youtube.com/watch?v=k2ZLQC8P7dc

整文标题： 【探索智能本质：François Chollet 谈 AGI 未来、ARC 基准与 NDI 实验室的颠覆性道路】

第一部分引言：AGI 展望、NDI实验室的创立与目标 (开始时间百分数 0% - 5%)

开场与背景介绍：主持人Garry Tan介绍嘉宾François Chollet，他是ARC Prize的创始人，也是探索新AI研究范式的实验室NDI的负责人。双方祝贺了ArcAGI V3基准的发布。
对AGI时间表的预测：François Chollet分享了他对通用人工智能（AGI）出现时间的预测，认为可能在2030年左右。他强调AI的发展势头不可阻挡，当前的重点应是思考如何利用和驾驭这股浪潮。
NDI实验室的目标：François Chollet解释了NDI实验室的使命。NDI是一个致力于AGI研究的新实验室，其目标并非在现有深度学习（如大语言模型）技术栈上做改进，而是要构建一个全新的机器学习分支，一种更接近“最优解”的、与深度学习“截然不同”的基础架构。

第二部分核心理念：符号程序合成与深度学习局限性剖析 (开始时间百分数 5% - 20%)

NDI的具体工作：符号程序合成：François Chollet澄清，NDI的工作并非高层的“代码生成”或“编码代理”，而是底层的“程序合成”。他们试图用“尽可能小的符号模型”来替代深度学习中使用的“参数曲线”（如神经网络权重）。
新方法“符号下降法”：由于符号模型无法使用传统的梯度下降法进行优化，NDI正在构建一种名为“符号下降法”的新优化方法，作为梯度下降在符号空间的等价物。
追求“最优性”的愿景：François Chollet认为，虽然现有基于大语言模型（LLM）的技术栈有效且有回报，但效率不够高，并非长期的最优解。AI领域终将向更优的方向发展。NDI的目标就是直接跨越到最优，在今天就构建未来最优AI的基础。他承认这条路成功概率或许只有10%-15%，但因为其潜在的重大意义且无人涉足，因此值得尝试。
深度学习的根本局限：François Chollet回顾了他2016年在Google Brain的研究经历，当时他试图训练深度学习模型解决逻辑推理和定理证明问题。他发现问题的症结不在于深度学习模型没有足够的“表达能力”，而在于“梯度下降”这个优化算法本身。梯度下降无法找到可泛化的、具有“推理风格”的程序，反而会陷入对输入数据的“模式匹配”和“过拟合”。
当前LLM的进步与局限：他承认当前大语言模型（如GPT-4）的进步令人惊讶，尤其是在代码和数学等“可形式化验证”的领域。因为这些领域能提供“可验证的奖励信号”，使得模型可以通过类似强化学习的方式自我改进，甚至整合“执行模型”。然而，对于无法形式化验证的领域（如撰写法律文书），进展会缓慢得多，因为模型严重依赖人类标注的高成本训练数据。

第三部分 ARC 基准的起源、演变与对AI进展的衡量 (开始时间百分数 20% - 35%)

ARC的创立初衷：由于意识到深度学习在推理上的根本局限，François Chollet在2017-2018年间希望创建一个“推理领域的ImageNet”，即ARC基准。其核心思想是衡量“智能作为一种规模化获取技能效率的手段”。
ARC V1：衡量“流体推理”：ARC V1发布于2019年，要求系统根据给定输入-输出网格，推断出底层规则。在2024年底推理模型（如OpenAI的o1）出现前，即使模型规模扩大了数万倍，基础语言模型在V1上的表现也极差（接近0%）。O1等推理模型在V1上出现的“阶跃式”性能飞跃，首次证明了“推理”作为一种新能力的出现。
ARC V2：揭示“目标化训练”范式：ARC V2保持了V1的格式，但难度和组合复杂度更高。2025年，基于代码的智能体（编码代理）通过“目标化训练”范式（即：模型生成类似任务 -> 尝试解决 -> 验证 -> 根据成功路径微调 -> 循环）迅速使V2饱和。这表明关键进步不在于模型本身“更聪明”，而在于新的、可自动化的“训练后范式”，这正是在“可验证奖励”领域实现自动化的关键。
“框架”的作用与AGI的差距：François Chollet指出，当前许多进展依赖于人类设计的“框架”（为特定任务定制的解决方案策略）。这恰恰说明我们距离真正的AGI还很远，因为AGI应该能自主创建框架，而不需要人类告知如何解决问题。

第四部分 ARC V3：从静态推理到交互式智能体的跃迁 (开始时间百分数 35% - 50%)

V3的核心革新：从“建模”到“智能体”：与V1/V2关注静态、被动的“建模”能力不同，ARC V3旨在衡量“智能体智能”。系统被置于一个全新的、类似迷你游戏的交互式环境中，没有指令和目标，必须通过试错自主探索、理解环境、发现目标、制定计划并高效解决。
设计目标：衡量“流体智力”：V3的关键是衡量“效率”，要求AI达到与人类首次接触时相近的探索和解决效率（几百到几千个行动步骤）。为此，V3包含一个庞大（超过250个）的私有游戏库，这些游戏由专门的内部工作室开发，避免借鉴现有游戏的文化符号，仅基于核心物理和主体性等“先天知识”，以防止通过记忆或“针对性训练”来作弊。
与过往游戏AI研究的区别：François Chollet对比了DeepMind的Atari游戏研究和OpenAI的Dota研究，指出那些研究是在“相同的”训练和测试环境中进行的，本质是“记忆最佳策略”。而ARC V3要求系统在“首次遇到”的游戏中进行评估，且每一步探索行动都计入效率得分，真正测试“流体智力”——即高效探索、构建环境模型并规划的能力。
技术挑战与未来版本：François Chollet认为，即使是当前最好的技术（如推理模型）也难以解决V3。他透露未来会有ARC V4和V5，V4将侧重于“持续性学习”和更长尺度的课程学习，V5则将围绕“创新”展开。ARC系列的终极目标是不断缩小前沿AI与人类学习效率之间的“可衡量差距”，当这个差距消失时，就是AGI到来的时刻。

第五部分对AI本质、实现路径与初创者的建议 (开始时间百分数 50% - 80%)

AGI的形态：小型核心引擎+庞大知识库：François Chollet预测，未来AGI将由一个极小的“流体智能引擎”（可能只有几兆字节的代码）和一个庞大的、可扩展的“知识库”组成。他认为这个核心引擎的代码可能非常简洁（甚至不到1万行），其原理可能几十年前就已潜藏，只是未被发现。
自我改进与“去人力化”循环：实现AGI的关键是尽可能将人类从系统的“改进循环”中移除，使系统能够自我改进，且改进速度能自我加速。当前LLM技术栈的优势之一就是能通过增加数据和计算来扩展知识库，减少人工干预。
NDI方法 vs. 科学与生物学：François Chollet将NDI的“符号程序合成”比作“科学的算法化”——即从大量观测数据中压缩出最简洁的符号规则（方程式）。他认为人类思维在高层次上也进行着类似的因果建模和程序合成，但人脑的实现并非最优。NDI的目标是从“第一性原理”出发，重新实现更高效的智能。
对研究者和初创者的建议：
- 探索多元化方法：他鼓励探索不同于主流深度学习的方法，例如遗传算法、状态空间模型等。当前AI研究过于集中，而早期（七八十年代）的研究则更多样化。
- 寻找可扩展性：成功方法的关键特征是“可扩展”，即系统能力的提升不能仅依赖于投入更多工程师的时间，而应能与人力投入“解耦”。
- 从“启动”到“自治”：即使像LLM这样的系统，初期也需要大量人类生成的数据（如互联网文本）作为“抽象概念”的启动燃料，但之后应能进入可自动生成训练数据的循环。
对开源项目维护的建议：François Chollet以Keras的成功为例，强调了“可用性”和“社区建设”的重要性。API应简单直观，文档应兼具教育和指导作用。他特别提到一个有效策略：雇佣社区中最热情的“超级用户”。

第六部分结语：拥抱变革，将AI转化为个人机遇 (开始时间百分数 80% - 100%)

对未来的积极心态：针对人们对AI可能导致失业的普遍焦虑，François Chollet持积极态度。他认为，专业知识（如编程）越多的人，越能利用AI工具赋能自己。他鼓励人们将技术进步视为机遇和改善生活的工具。
核心倡议：他强调AI发展已势不可挡，当前最应关注的问题不是阻止它，而是“如何利用它？如何发挥它的优势？如何乘风破浪？”。
结束语：采访在主持人的感谢中结束，肯定了François Chollet作为领导者和先驱者的角色，并鼓励观众以学习者和利用者的心态面对AI时代。

DEV Community

François Chollet 谈 AGI 未来

Top comments (0)