DEV Community

cognitalk
cognitalk

Posted on

François Chollet 谈 AGI 未来

原播客链接:https://www.youtube.com/watch?v=k2ZLQC8P7dc

整文标题: 【探索智能本质:François Chollet 谈 AGI 未来、ARC 基准与 NDI 实验室的颠覆性道路】


第一部分 引言:AGI 展望、NDI实验室的创立与目标 (开始时间百分数 0% - 5%)

  1. 开场与背景介绍:主持人Garry Tan介绍嘉宾François Chollet,他是ARC Prize的创始人,也是探索新AI研究范式的实验室NDI的负责人。双方祝贺了ArcAGI V3基准的发布。
  2. 对AGI时间表的预测:François Chollet分享了他对通用人工智能(AGI)出现时间的预测,认为可能在2030年左右。他强调AI的发展势头不可阻挡,当前的重点应是思考如何利用和驾驭这股浪潮。
  3. NDI实验室的目标:François Chollet解释了NDI实验室的使命。NDI是一个致力于AGI研究的新实验室,其目标并非在现有深度学习(如大语言模型)技术栈上做改进,而是要构建一个全新的机器学习分支,一种更接近“最优解”的、与深度学习“截然不同”的基础架构。

第二部分 核心理念:符号程序合成与深度学习局限性剖析 (开始时间百分数 5% - 20%)

  1. NDI的具体工作:符号程序合成:François Chollet澄清,NDI的工作并非高层的“代码生成”或“编码代理”,而是底层的“程序合成”。他们试图用“尽可能小的符号模型”来替代深度学习中使用的“参数曲线”(如神经网络权重)。
  2. 新方法“符号下降法”:由于符号模型无法使用传统的梯度下降法进行优化,NDI正在构建一种名为“符号下降法”的新优化方法,作为梯度下降在符号空间的等价物。
  3. 追求“最优性”的愿景:François Chollet认为,虽然现有基于大语言模型(LLM)的技术栈有效且有回报,但效率不够高,并非长期的最优解。AI领域终将向更优的方向发展。NDI的目标就是直接跨越到最优,在今天就构建未来最优AI的基础。他承认这条路成功概率或许只有10%-15%,但因为其潜在的重大意义且无人涉足,因此值得尝试。
  4. 深度学习的根本局限:François Chollet回顾了他2016年在Google Brain的研究经历,当时他试图训练深度学习模型解决逻辑推理和定理证明问题。他发现问题的症结不在于深度学习模型没有足够的“表达能力”,而在于“梯度下降”这个优化算法本身。梯度下降无法找到可泛化的、具有“推理风格”的程序,反而会陷入对输入数据的“模式匹配”和“过拟合”。
  5. 当前LLM的进步与局限:他承认当前大语言模型(如GPT-4)的进步令人惊讶,尤其是在代码和数学等“可形式化验证”的领域。因为这些领域能提供“可验证的奖励信号”,使得模型可以通过类似强化学习的方式自我改进,甚至整合“执行模型”。然而,对于无法形式化验证的领域(如撰写法律文书),进展会缓慢得多,因为模型严重依赖人类标注的高成本训练数据。

第三部分 ARC 基准的起源、演变与对AI进展的衡量 (开始时间百分数 20% - 35%)

  1. ARC的创立初衷:由于意识到深度学习在推理上的根本局限,François Chollet在2017-2018年间希望创建一个“推理领域的ImageNet”,即ARC基准。其核心思想是衡量“智能作为一种规模化获取技能效率的手段”。
  2. ARC V1:衡量“流体推理”:ARC V1发布于2019年,要求系统根据给定输入-输出网格,推断出底层规则。在2024年底推理模型(如OpenAI的o1)出现前,即使模型规模扩大了数万倍,基础语言模型在V1上的表现也极差(接近0%)。O1等推理模型在V1上出现的“阶跃式”性能飞跃,首次证明了“推理”作为一种新能力的出现。
  3. ARC V2:揭示“目标化训练”范式:ARC V2保持了V1的格式,但难度和组合复杂度更高。2025年,基于代码的智能体(编码代理)通过“目标化训练”范式(即:模型生成类似任务 -> 尝试解决 -> 验证 -> 根据成功路径微调 -> 循环)迅速使V2饱和。这表明关键进步不在于模型本身“更聪明”,而在于新的、可自动化的“训练后范式”,这正是在“可验证奖励”领域实现自动化的关键。
  4. “框架”的作用与AGI的差距:François Chollet指出,当前许多进展依赖于人类设计的“框架”(为特定任务定制的解决方案策略)。这恰恰说明我们距离真正的AGI还很远,因为AGI应该能自主创建框架,而不需要人类告知如何解决问题。

第四部分 ARC V3:从静态推理到交互式智能体的跃迁 (开始时间百分数 35% - 50%)

  1. V3的核心革新:从“建模”到“智能体”:与V1/V2关注静态、被动的“建模”能力不同,ARC V3旨在衡量“智能体智能”。系统被置于一个全新的、类似迷你游戏的交互式环境中,没有指令和目标,必须通过试错自主探索、理解环境、发现目标、制定计划并高效解决。
  2. 设计目标:衡量“流体智力”:V3的关键是衡量“效率”,要求AI达到与人类首次接触时相近的探索和解决效率(几百到几千个行动步骤)。为此,V3包含一个庞大(超过250个)的私有游戏库,这些游戏由专门的内部工作室开发,避免借鉴现有游戏的文化符号,仅基于核心物理和主体性等“先天知识”,以防止通过记忆或“针对性训练”来作弊。
  3. 与过往游戏AI研究的区别:François Chollet对比了DeepMind的Atari游戏研究和OpenAI的Dota研究,指出那些研究是在“相同的”训练和测试环境中进行的,本质是“记忆最佳策略”。而ARC V3要求系统在“首次遇到”的游戏中进行评估,且每一步探索行动都计入效率得分,真正测试“流体智力”——即高效探索、构建环境模型并规划的能力。
  4. 技术挑战与未来版本:François Chollet认为,即使是当前最好的技术(如推理模型)也难以解决V3。他透露未来会有ARC V4和V5,V4将侧重于“持续性学习”和更长尺度的课程学习,V5则将围绕“创新”展开。ARC系列的终极目标是不断缩小前沿AI与人类学习效率之间的“可衡量差距”,当这个差距消失时,就是AGI到来的时刻。

第五部分 对AI本质、实现路径与初创者的建议 (开始时间百分数 50% - 80%)

  1. AGI的形态:小型核心引擎+庞大知识库:François Chollet预测,未来AGI将由一个极小的“流体智能引擎”(可能只有几兆字节的代码)和一个庞大的、可扩展的“知识库”组成。他认为这个核心引擎的代码可能非常简洁(甚至不到1万行),其原理可能几十年前就已潜藏,只是未被发现。
  2. 自我改进与“去人力化”循环:实现AGI的关键是尽可能将人类从系统的“改进循环”中移除,使系统能够自我改进,且改进速度能自我加速。当前LLM技术栈的优势之一就是能通过增加数据和计算来扩展知识库,减少人工干预。
  3. NDI方法 vs. 科学与生物学:François Chollet将NDI的“符号程序合成”比作“科学的算法化”——即从大量观测数据中压缩出最简洁的符号规则(方程式)。他认为人类思维在高层次上也进行着类似的因果建模和程序合成,但人脑的实现并非最优。NDI的目标是从“第一性原理”出发,重新实现更高效的智能。
  4. 对研究者和初创者的建议
    • 探索多元化方法:他鼓励探索不同于主流深度学习的方法,例如遗传算法、状态空间模型等。当前AI研究过于集中,而早期(七八十年代)的研究则更多样化。
    • 寻找可扩展性:成功方法的关键特征是“可扩展”,即系统能力的提升不能仅依赖于投入更多工程师的时间,而应能与人力投入“解耦”。
    • 从“启动”到“自治”:即使像LLM这样的系统,初期也需要大量人类生成的数据(如互联网文本)作为“抽象概念”的启动燃料,但之后应能进入可自动生成训练数据的循环。
  5. 对开源项目维护的建议:François Chollet以Keras的成功为例,强调了“可用性”和“社区建设”的重要性。API应简单直观,文档应兼具教育和指导作用。他特别提到一个有效策略:雇佣社区中最热情的“超级用户”。

第六部分 结语:拥抱变革,将AI转化为个人机遇 (开始时间百分数 80% - 100%)

  1. 对未来的积极心态:针对人们对AI可能导致失业的普遍焦虑,François Chollet持积极态度。他认为,专业知识(如编程)越多的人,越能利用AI工具赋能自己。他鼓励人们将技术进步视为机遇和改善生活的工具。
  2. 核心倡议:他强调AI发展已势不可挡,当前最应关注的问题不是阻止它,而是“如何利用它?如何发挥它的优势?如何乘风破浪?”。
  3. 结束语:采访在主持人的感谢中结束,肯定了François Chollet作为领导者和先驱者的角色,并鼓励观众以学习者和利用者的心态面对AI时代。

Top comments (0)