DEV Community

cognitalk
cognitalk

Posted on

AI的暗产出(AI Dark Output)

这期视频的主题是 “AI的暗产出(AI Dark Output)”。视频深入探讨了为什么在 AI 如此火热、各大科技巨头市值飙升的今天,官方的宏观经济数据(如 GDP 和生产力统计)却几乎看不到 AI 对经济的提升。

以下是视频内容的极其详细拆解,不遗漏其核心论点、历史类比和底层逻辑:


1. 核心矛盾:索洛悖论的 AI 版

  • 现状的撕裂: 科技头条都在鼓吹 AI 改变世界,美股科技巨头(Mag 7)市值飙升 [00:10],但官方宏观经济数据里,AI 对生产力的提升却“几乎看不到” [00:26]。
  • 历史的重演(索洛悖论): 诺贝尔经济学奖得主罗伯特·索洛在 1987 年曾说:“你可以 famine 在任何地方看到计算机时代,除了在生产力的统计数据里。” [00:44] 直到 2013 年,美国经济分析局(BEA)修改了 GDP 核算方法(把研发支出和知识产权投资正式记入 GDP),才把 1990 年代的总产出“凭空”拉高了 3.65 万亿美元(相当于当年 GDP 的近 30%,一个德国的经济规模) [00:55]。
  • 当前的危机: 今天的 AI 测量问题比当年的计算机革命严重得多 [01:23]。AI 创造的大部分经济价值,可能永远不会出现在传统 GDP 里。这种存在但无法被国家账户捕捉到的产出,被称为 “AI 暗产出” [01:34]。美联储即将上任的主席凯文·沃什(Kevin Warsh)在 2025 年底的演讲中也委婉承认,现有的经济统计系统已经坏了,无法准确反映 AI 时代的经济现实 [02:09]。

2. 什么是 AI 暗产出?(三大分类)

视频将暗产出分为了两大核心类别,以及一种特殊类别:

① 替代型暗产出(Substitution Dark Output)

  • 定义: 以前由人类完成的工作,现在由 AI 来完成 [04:01]。目前当前一代 AI 已经有能力显著增强或自编码价值约 1.5 万亿美元的劳动力任务 [04:08]。
  • 经典案例(遗嘱的起草):
  • 一份遗嘱无论谁写,对用户的真实价值是一样的。但服务业 GDP 很难衡量数量,通常只能通过律师的收入来估算 [04:22]。
  • 当 AI 接管了这项工作,原来付给律师的几百美元变成了给 AI 公司的几美元 Token 费用 [04:52]。更讽刺的是,由于最简单、最便宜的业务被 AI 做掉了,剩下的律师只做复杂高收费业务,政府去调查时反而会发现律师的平均服务价格“上涨”了 [05:00]。
  • 统计系统会错误地解读为:法律服务产出下降、价格上升(通胀);而实际上是生产力暴涨。

  • 历史大跨度对比(一份基本遗嘱的价格变化):

  • 中世纪(抄写员手写):相当于今天几千美元 [05:36]。

  • 文艺复兴(公证人):约 1000 美元 [05:43]。

  • 1900 年 / 1990 年(律师):约 150 美元 [05:50]。

  • 2010 年(在线法律服务 LegalZoom):约 50 美元 [05:59]。

  • 2026 年今天(大模型 API):0.5 美元(一年内跌幅超 99%) [06:03]。这种断崖式的价格下跌让它直接在统计数据中“隐形”了。

② 新增型暗产出(Incremental Dark Output)

  • 定义: 在 AI 出现之前,根本不会有人去做的工作 [07:24]。不是没有价值,而是以前用人工来做的成本太高,人们雇不起。
  • 经典案例(学术文献综述与背景调查):
  • 以前博士生做一次全面文献综述要几周,成本 2000 美元 [07:41]。
  • 现在用 AI 只要 2 美元 [07:55]。于是人们在面试员工、与伙伴开会、做小项目前,都会让 AI 去疯狂总结几百页的论文和行业报告 [08:07]。
  • 这创造了巨大的、帮人节省时间并提高决策质量的经济价值。但除了那几美元的 Token 费,它没有发票、没有合同、没有工资单,在 GDP 统计中是完全无形的 [08:30]。

③ 特殊类别:被捕获的 AI 产出(Captured AI Output)

  • 定义: 工作由 AI 替代了,但由于企业拥有真正的市场垄断/定价权,它仍收取跟以前一样的高昂价格 [09:30]。
  • 情况 A(外部购买): 企业向 AI 人力资源公司购买一项原本价值 1 万美元的服务,价格还是 1 万美元。此时 GDP 保持不变,但钱从工人工资变成了企业利润 [09:51]。
  • 情况 B(内部生产): 企业决定不从外部买,而是自己在内部用 AI 搞定,成本变成 10 美元 Token。此时 GDP 直接凭空减少了 9990 美元,尽管其产出的质量和数量毫无变化 [10:15]。
  • 结论: AI 正在将大量经济活动从外部市场交易推向公司内部生产,从而导致它们在 GDP 中集体消失 [10:45]。

3. 制造业 vs 服务业:为什么制造业没有这种统计难题?

  • 制造业“有东西可以数”: 工业革命中,如果机械师做螺丝效率变高,工厂就会报告生产了更多数量的螺丝,实际 GDP 就会增长 [11:12]。过去 600 年,铁螺丝的实际价格下降了 99% 以上,但全球产量增加了 100 亿倍,GDP 完美捕捉到了这一生产力暴涨 [11:29]。
  • 服务业“缺乏标準单位”: 我们无法像测量机器力气用“马力”一样,找出一个衡量的“脑力”单位 [11:49]。
  • Token 不能作为产出单位: 100 万个 Token 可以生成一堆垃圾,也可以生成一份改变公司战略的顶级简报 [12:10]。服务业的产出是无形、不可计数且不可标准化的,当 AI 将其效率提升 100 倍时,统计系统只能看到企业的服务收入在下降,却看不到生产力在爆炸 [12:39]。

4. 证明“暗产出”存在的三个市场指纹

既然无法直接观测,我们怎么知道暗产出真实存在?视频提出了三个反常的“经济指纹”:

  1. 初级员工先被替代,导致行业平均工资反常上升: 公司裁掉做重复性工作的低薪初级员工,留下高薪高级员工。导致统计样本里行业平均工资上涨,但实际上没有任何人获得真正意义上的加薪 [13:06]。
  2. AI 暴露度最高的行业:就业相对下降,但相对工资却在上升 [13:34]。 这不符合传统供需规律,是人工被 AI 替代并留任高产出核心员工的明确信号。
  3. 大量消耗 Token,但软件投资数据未见异常: 2026 年 3 月数据显示,37% 的 Token 被用于计算机和数学领域,但软件投资对 GDP 的贡献完全没偏离历史趋势 [14:14]。这证明大量的 Token 没有被用来替代原有的软件工程,而是花在了以前根本不存在的“新增型”任务上 [14:30]。

5. 评估 AI 替代潜力的“证据阶梯”(Six-Step Ladder of Evidence)

视频强调,不要相信昂贵、缓慢、主观且向后看的“AI 基准测试”(Benchmark) [14:51]。AI 不需要打败世界上最好的律师,它只需要足够便宜、好用,能替代普通工人即可 [15:09]。为此,评估 AI 的真实经济影响应建立在市场信号的六级证据阶梯上 [15:37]:

  • 第 1 级 & 第 2 级: 基准测试驱动的证据(仅能说明在测试条件下模型能完成该任务) [15:41]。
  • 第 3 级(炒作层): 公司公开宣称自己的产品能完成某项工作 [15:52]。
  • 第 4 级: 公司公开宣布该 AI 工具已在生产环境(Production Environment)中实际使用 [16:07]。
  • 第 5 级: 公司在法庭上成功为 AI 生成的工作进行了辩护(说明输出已达到法律认可标准) [16:15]。
  • 第 6 级(最强证据): 保险公司愿意为 AI 的工作风险承保(意味着中立的第三方已经对 AI 的失败模式进行了量化定价,并愿意承担风险) [16:22]。

前文提到的 1.5 万亿美元数字,正是基于第 4 级以上的坚实市场证据估算出来的 [16:37]。


6. 导致统计崩溃 return 的四种测量错误

宏观经济数据是一切政策和投资的基石,但 AI 的到来通过四种错误让系统彻底崩塌:

  1. 边界转移(Boundary Shift): 以前在市场上发生、可被统计的交易(如雇外部承包商),变成了公司内部或家庭内部的 AI 工作流。交易消失了,在 GDP 中隐形了 [17:23]。
  2. 价格崩溃(Price Collapse): 服务业收入和工时大幅下降。统计系统由于数不出服务件数,会误认为这是经济萧条和恶性通胀,但实际上是生产力的大爆炸 [17:59]。
  3. 行业错配(Sector Mismatch): AI 在医疗/法律等行业创造了巨大效率,但唯一的交易数据只体现在了科技/AI 公司的 Token 账单里 [18:38]。这会让政府误以为医疗行业停滞不前需要改制,从而做出错误的政策引导 [19:13]。
  4. 新工作的不可见性(Invisibility of New Work): 几分钟、几分钱就完成的原本价值数千美元的新增工作,因为除了 Token 没有任何收据,在宏观经济衡量中被完全抹去 [19:25]。

7. 深刻的历史类比:女性主义经济学与无偿劳动

为了让人更深刻理解 GDP 的本质漏洞,视频引入了一个经济学历史上的重大类比——女性主义经济学(Feminist Economics) [22:01]:

  • GDP 的历史盲区: 长期以来,GDP 完完全全忽略了无偿的家务劳动和护理工作 [22:13]。1988 年学者玛丽莲·沃林(Marilyn Waring)指出,最初起草国民账户体系的委员会里 100% 都是男性,创始文件直接一句话就把妇女抚养孩子、照顾老人的巨大贡献打为“对国民账户几乎没有重要性” [22:21]。
  • 隐形巨人的规模: 后续研究显示,澳大利亚的家庭经济规模占其整个市场经济的 78% [22:45];英国更指出家庭生产相当于 GDP 的 63.1% [22:53]。国际劳工组织(ILO)估计,全球每天有 164 亿小时的无偿护理,价值每年 11 万亿美元(是全球科技行业的 3 倍),但在 GDP 里它的计价永远是 [22:58]。
  • 里德诊断标准(Reid's Standard): 经济学家玛格丽特·里德在 1934 年提出:“如果一项工作可以委托给付费的第三方,那它就是生产性的。” [23:32] 雇管家做饭算 GDP,自己家人做饭就不算 GDP [23:43]。
  • AI 的映射: AI 使得几乎每一项信息和智力任务(写简报、分析财报、分流病人)都可以被“委託” [23:55]。原本由人类完成并记入 GDP 的工作,现在委派给 AI 后,在国民账户中就沦为了被埋在科技公司账单里、价值近乎为零的“无常劳动” [24:12]。

8. 总结与未来的警示

虽然几十年来,美联储和经济分析局一直在通过各种指数(如链式加权、中介需求 PPI、将软件和研发资本化)来改进服务业核算,但核心逻辑依然没变:它们是用美元,而不是用实际单位去衡量的 [25:16]。

当我们迈入一个生产力大爆炸的时代,如果继续沿用为旧时代设计的 GDP 尺子,AI 的繁荣在数据中就会反常地被解读为“AI 萧条” [20:15]。这不仅会让批评者轻易将其斥为泡沫,更会导致政府在制定货币政策、衡量失业与通胀、以及基于劳动力征税时犯下严重错误 [20:43, 21:21]。

暗产出是这个时代最大的经济测量难题。我们能清晰看到 AI 带来的所有成本和破坏(能耗、水耗、裁员) [21:36],却对它创造的巨大隐形价值视而不见。这迫切需要人类更新经济测量工具,重新思考我们到底想要衡量什么。

Top comments (0)