cognitalk

Posted on Jun 2 • Edited on Jun 8

AI的暗产出（AI Dark Output）

#ai #podcast #economics #dark

https://www.youtube.com/watch?v=WNTN9o8hYDw
这期视频的主题是 “AI的暗产出（AI Dark Output）”。视频深入探讨了为什么在 AI 如此火热、各大科技巨头市值飙升的今天，官方的宏观经济数据（如 GDP 和生产力统计）却几乎看不到 AI 对经济的提升。

以下是视频内容的极其详细拆解，不遗漏其核心论点、历史类比和底层逻辑：

1. 核心矛盾：索洛悖论的 AI 版

现状的撕裂： 科技头条都在鼓吹 AI 改变世界，美股科技巨头（Mag 7）市值飙升 [00:10]，但官方宏观经济数据里，AI 对生产力的提升却“几乎看不到” [00:26]。
历史的重演（索洛悖论）： 诺贝尔经济学奖得主罗伯特·索洛在 1987 年曾说：“你可以 famine 在任何地方看到计算机时代，除了在生产力的统计数据里。” [00:44] 直到 2013 年，美国经济分析局（BEA）修改了 GDP 核算方法（把研发支出和知识产权投资正式记入 GDP），才把 1990 年代的总产出“凭空”拉高了 3.65 万亿美元（相当于当年 GDP 的近 30%，一个德国的经济规模） [00:55]。
当前的危机： 今天的 AI 测量问题比当年的计算机革命严重得多 [01:23]。AI 创造的大部分经济价值，可能永远不会出现在传统 GDP 里。这种存在但无法被国家账户捕捉到的产出，被称为 “AI 暗产出” [01:34]。美联储即将上任的主席凯文·沃什（Kevin Warsh）在 2025 年底的演讲中也委婉承认，现有的经济统计系统已经坏了，无法准确反映 AI 时代的经济现实 [02:09]。

2. 什么是 AI 暗产出？（三大分类）

视频将暗产出分为了两大核心类别，以及一种特殊类别：

① 替代型暗产出（Substitution Dark Output）

定义： 以前由人类完成的工作，现在由 AI 来完成 [04:01]。目前当前一代 AI 已经有能力显著增强或自编码价值约 1.5 万亿美元的劳动力任务 [04:08]。
经典案例（遗嘱的起草）：
一份遗嘱无论谁写，对用户的真实价值是一样的。但服务业 GDP 很难衡量数量，通常只能通过律师的收入来估算 [04:22]。
当 AI 接管了这项工作，原来付给律师的几百美元变成了给 AI 公司的几美元 Token 费用 [04:52]。更讽刺的是，由于最简单、最便宜的业务被 AI 做掉了，剩下的律师只做复杂高收费业务，政府去调查时反而会发现律师的平均服务价格“上涨”了 [05:00]。
统计系统会错误地解读为：法律服务产出下降、价格上升（通胀）；而实际上是生产力暴涨。
历史大跨度对比（一份基本遗嘱的价格变化）：
中世纪（抄写员手写）：相当于今天几千美元 [05:36]。
文艺复兴（公证人）：约 1000 美元 [05:43]。
1900 年 / 1990 年（律师）：约 150 美元 [05:50]。
2010 年（在线法律服务 LegalZoom）：约 50 美元 [05:59]。
2026 年今天（大模型 API）：0.5 美元（一年内跌幅超 99%） [06:03]。这种断崖式的价格下跌让它直接在统计数据中“隐形”了。

② 新增型暗产出（Incremental Dark Output）

定义： 在 AI 出现之前，根本不会有人去做的工作 [07:24]。不是没有价值，而是以前用人工来做的成本太高，人们雇不起。
经典案例（学术文献综述与背景调查）：
以前博士生做一次全面文献综述要几周，成本 2000 美元 [07:41]。
现在用 AI 只要 2 美元 [07:55]。于是人们在面试员工、与伙伴开会、做小项目前，都会让 AI 去疯狂总结几百页的论文和行业报告 [08:07]。
这创造了巨大的、帮人节省时间并提高决策质量的经济价值。但除了那几美元的 Token 费，它没有发票、没有合同、没有工资单，在 GDP 统计中是完全无形的 [08:30]。

③ 特殊类别：被捕获的 AI 产出（Captured AI Output）

定义： 工作由 AI 替代了，但由于企业拥有真正的市场垄断/定价权，它仍收取跟以前一样的高昂价格 [09:30]。
情况 A（外部购买）： 企业向 AI 人力资源公司购买一项原本价值 1 万美元的服务，价格还是 1 万美元。此时 GDP 保持不变，但钱从工人工资变成了企业利润 [09:51]。
情况 B（内部生产）： 企业决定不从外部买，而是自己在内部用 AI 搞定，成本变成 10 美元 Token。此时 GDP 直接凭空减少了 9990 美元，尽管其产出的质量和数量毫无变化 [10:15]。
结论： AI 正在将大量经济活动从外部市场交易推向公司内部生产，从而导致它们在 GDP 中集体消失 [10:45]。

3. 制造业 vs 服务业：为什么制造业没有这种统计难题？

制造业“有东西可以数”： 工业革命中，如果机械师做螺丝效率变高，工厂就会报告生产了更多数量的螺丝，实际 GDP 就会增长 [11:12]。过去 600 年，铁螺丝的实际价格下降了 99% 以上，但全球产量增加了 100 亿倍，GDP 完美捕捉到了这一生产力暴涨 [11:29]。
服务业“缺乏标準单位”： 我们无法像测量机器力气用“马力”一样，找出一个衡量的“脑力”单位 [11:49]。
Token 不能作为产出单位： 100 万个 Token 可以生成一堆垃圾，也可以生成一份改变公司战略的顶级简报 [12:10]。服务业的产出是无形、不可计数且不可标准化的，当 AI 将其效率提升 100 倍时，统计系统只能看到企业的服务收入在下降，却看不到生产力在爆炸 [12:39]。

4. 证明“暗产出”存在的三个市场指纹

既然无法直接观测，我们怎么知道暗产出真实存在？视频提出了三个反常的“经济指纹”：

初级员工先被替代，导致行业平均工资反常上升： 公司裁掉做重复性工作的低薪初级员工，留下高薪高级员工。导致统计样本里行业平均工资上涨，但实际上没有任何人获得真正意义上的加薪 [13:06]。
AI 暴露度最高的行业：就业相对下降，但相对工资却在上升 [13:34]。 这不符合传统供需规律，是人工被 AI 替代并留任高产出核心员工的明确信号。
大量消耗 Token，但软件投资数据未见异常： 2026 年 3 月数据显示，37% 的 Token 被用于计算机和数学领域，但软件投资对 GDP 的贡献完全没偏离历史趋势 [14:14]。这证明大量的 Token 没有被用来替代原有的软件工程，而是花在了以前根本不存在的“新增型”任务上 [14:30]。

5. 评估 AI 替代潜力的“证据阶梯”（Six-Step Ladder of Evidence）

视频强调，不要相信昂贵、缓慢、主观且向后看的“AI 基准测试”（Benchmark） [14:51]。AI 不需要打败世界上最好的律师，它只需要足够便宜、好用，能替代普通工人即可 [15:09]。为此，评估 AI 的真实经济影响应建立在市场信号的六级证据阶梯上 [15:37]：

第 1 级 & 第 2 级： 基准测试驱动的证据（仅能说明在测试条件下模型能完成该任务） [15:41]。
第 3 级（炒作层）： 公司公开宣称自己的产品能完成某项工作 [15:52]。
第 4 级： 公司公开宣布该 AI 工具已在生产环境（Production Environment）中实际使用 [16:07]。
第 5 级： 公司在法庭上成功为 AI 生成的工作进行了辩护（说明输出已达到法律认可标准） [16:15]。
第 6 级（最强证据）： 保险公司愿意为 AI 的工作风险承保（意味着中立的第三方已经对 AI 的失败模式进行了量化定价，并愿意承担风险） [16:22]。

前文提到的 1.5 万亿美元数字，正是基于第 4 级以上的坚实市场证据估算出来的 [16:37]。

6. 导致统计崩溃 return 的四种测量错误

宏观经济数据是一切政策和投资的基石，但 AI 的到来通过四种错误让系统彻底崩塌：

边界转移（Boundary Shift）： 以前在市场上发生、可被统计的交易（如雇外部承包商），变成了公司内部或家庭内部的 AI 工作流。交易消失了，在 GDP 中隐形了 [17:23]。
价格崩溃（Price Collapse）： 服务业收入和工时大幅下降。统计系统由于数不出服务件数，会误认为这是经济萧条和恶性通胀，但实际上是生产力的大爆炸 [17:59]。
行业错配（Sector Mismatch）： AI 在医疗/法律等行业创造了巨大效率，但唯一的交易数据只体现在了科技/AI 公司的 Token 账单里 [18:38]。这会让政府误以为医疗行业停滞不前需要改制，从而做出错误的政策引导 [19:13]。
新工作的不可见性（Invisibility of New Work）： 几分钟、几分钱就完成的原本价值数千美元的新增工作，因为除了 Token 没有任何收据，在宏观经济衡量中被完全抹去 [19:25]。

7. 深刻的历史类比：女性主义经济学与无偿劳动

为了让人更深刻理解 GDP 的本质漏洞，视频引入了一个经济学历史上的重大类比——女性主义经济学（Feminist Economics） [22:01]：

GDP 的历史盲区： 长期以来，GDP 完完全全忽略了无偿的家务劳动和护理工作 [22:13]。1988 年学者玛丽莲·沃林（Marilyn Waring）指出，最初起草国民账户体系的委员会里 100% 都是男性，创始文件直接一句话就把妇女抚养孩子、照顾老人的巨大贡献打为“对国民账户几乎没有重要性” [22:21]。
隐形巨人的规模： 后续研究显示，澳大利亚的家庭经济规模占其整个市场经济的 78% [22:45]；英国更指出家庭生产相当于 GDP 的 63.1% [22:53]。国际劳工组织（ILO）估计，全球每天有 164 亿小时的无偿护理，价值每年 11 万亿美元（是全球科技行业的 3 倍），但在 GDP 里它的计价永远是零 [22:58]。
里德诊断标准（Reid's Standard）： 经济学家玛格丽特·里德在 1934 年提出：“如果一项工作可以委托给付费的第三方，那它就是生产性的。” [23:32] 雇管家做饭算 GDP，自己家人做饭就不算 GDP [23:43]。
AI 的映射： AI 使得几乎每一项信息和智力任务（写简报、分析财报、分流病人）都可以被“委託” [23:55]。原本由人类完成并记入 GDP 的工作，现在委派给 AI 后，在国民账户中就沦为了被埋在科技公司账单里、价值近乎为零的“无常劳动” [24:12]。

8. 总结与未来的警示

虽然几十年来，美联储和经济分析局一直在通过各种指数（如链式加权、中介需求 PPI、将软件和研发资本化）来改进服务业核算，但核心逻辑依然没变：它们是用美元，而不是用实际单位去衡量的 [25:16]。

当我们迈入一个生产力大爆炸的时代，如果继续沿用为旧时代设计的 GDP 尺子，AI 的繁荣在数据中就会反常地被解读为“AI 萧条” [20:15]。这不仅会让批评者轻易将其斥为泡沫，更会导致政府在制定货币政策、衡量失业与通胀、以及基于劳动力征税时犯下严重错误 [20:43, 21:21]。

暗产出是这个时代最大的经济测量难题。我们能清晰看到 AI 带来的所有成本和破坏（能耗、水耗、裁员） [21:36]，却对它创造的巨大隐形价值视而不见。这迫切需要人类更新经济测量工具，重新思考我们到底想要衡量什么。

DEV Community