AI 数据中心网络演进中铜（Copper）与板载共封装光学（CPO - Co-Packaged Optics）

#ai #podcast #cpo #hardware

https://www.youtube.com/watch?v=-HppUFVl-Ak
这视频由知名半导体分析机构 SemiAnalysis 发布，围绕 AI 数据中心网络演进中铜（Copper）与板载共封装光学（CPO - Co-Packaged Optics）的竞争和未来进行了极其硬核且详细的深度拆解。

视频的核心逻辑可分为以下几个关键板块：

一、背景：铜的物理极限与三大网络层级

1. 铜的物理极限

视频开篇强调，半导体一直依赖铜（如芯片金属层、主板走线、NVL72机架的背板总线）。但当单通道传输速率达到 200 Gbits/second (每路) 及以上时，铜的传输距离极限被死死卡在 2米以内 [00:55]。超过这个距离，现代 AI 服务器的庞大带宽需求就只能依赖光纤和激光 [01:01]。

2. AI 数据中心的三大网络层级 [01:43]

前端网络（Front-end Network）： 负责基础的数据加载、SSH 访问和用户请求，带宽要求最低 [01:51]。
纵向扩展网络（Scale-up Network）： 连接单机架内的所有计算和网络托盘（如英伟达的 NVLink），让多张 GPU 能以极高带宽、极低延迟像“单张 GPU”一样协同工作 [02:07]。其带宽需求是 Scale-out 的 10 倍 [03:47]。
横向扩展网络（Scale-out Network）： 负责机架与机架之间、甚至整个数据中心范围内的服务器互联 [03:00]。其带宽需求是前端网络的 8 到 10 倍 [03:47]。

二、传统可插拔光模块（Pluggable Transceivers）的致命痛点

在需要跨机架的 Scale-out 网络中，目前行业标配是可插拔光模块（如 OSFP、QSFP-DD） [04:29]。
视频拆解了它的四大组成部分：物理接口、DSP（数字信号处理器）、TOSA（激光发射组件）、ROSA（光接收组件） [05:03]。

视频提出了一个颠覆直觉的事实：耗电和延迟的元凶根本不是激光器（仅占15%功耗），而是 DSP。 [06:06]

功耗： DSP 消耗了光模块高达 60% 以上 的电能 [06:21]。
延迟： 信号从电转换到光通常会带来 150 到 200 纳秒的延迟，其中 90% 以上由 DSP 造成 [06:28]。

为什么必须要 DSP？
因为 GPU 或交换机生成的电信号，在穿过芯片封装、主板走线到达机架边缘的光模块（约 30 厘米距离）时，信号已经严重衰减和失真，必须通过 DSP 进行放大和“清洗” [07:17]。而 CPO 的核心存在意义，就是将光学引擎无限靠近源头，彻底消灭 DSP [06:57]。

三、从 LPO 到 CPO 的技术演进路径

为了干掉 DSP，行业尝试了多种方案：

LPO（线性可插拔光模块）： 做法很大胆，直接拿掉可插拔模块里的 DSP，强行把失真的电信号转成光信号发出去。虽然有用，但极大牺牲了传输距离 [08:25]。
OBO（板载光学）： 把光模块从机架边缘移到主板上更靠近芯片的位置。但由于距离还不够近，没能彻底干掉 DSP，同时还丢掉了可插拔的便利性，宣告失败 [09:06]。
NPO（近封装光学）： 将光学引擎移至与 ASIC（交换机芯片/GPU）极近的特殊高特性基板上，是目前正在落地的折中方案 [09:38]。
CPO（共封装光学）： 终极形态，将光学引擎与芯片直接封装在同一个 Package 上 [10:01]。

视频中拆解的 CPO 三大阶梯（Tiers）：

第一阶梯（最低限度）： 光学引擎与交换机芯片在同一封装基板上，通过铜走线连接。虽干掉了 DSP，但仍需要 SerDes 进行并行/串行信号转换 [10:31]。
第二阶梯（中介层集成）： 芯片与光学引擎坐落在同一个硅基或有机中介层（Interposer）上，互连密度大幅提升，彻底不再需要 SerDes，实现完全的并行集成 [11:01]。
终极 Boss 级： 利用混合键合（Hybrid Bonding）等 3D 堆叠技术（2.5D 如台积电的 COW-AMH），将光学引擎直接叠在芯片上方或下方，实现极致的低功耗 [11:31]。

四、 CPO 的商业落地博弈：Scale-out 网络

CPO 的首个落地目标是替代 Scale-out 网络中的传统光模块 [12:46]。然而，行业对此产生了严重分歧：

传统可插拔的优势： 坏了极易更换（运维成本低）；标准统一、供应商极多，大厂拥有极强的价格控制权且能避免供应商锁定（Vendor Lock-in） [13:29]。
CPO 的软肋： 它是封装级别的。如果你买英伟达或博通的 CPO 芯片，你就必须绑定购买他们的整套光学方案；一旦其中一个通道坏了，你无法单独维修，必须报废更换整个昂贵的交换机 [14:11]。
市场现状：
超级云巨头（Hyperscalers）： 非常看重供应链多样性和价格把控，对全力拥抱 CPO 仍持谨慎态度，甚至在推动 NPO 混合方案 [16:00]。
新一代 AI 云（Neoclouds）： 更喜欢买来即用的 Turnkey 整体方案，因此对英伟达的 CPO 交换机表现出极高热情 [16:48]。

五、终极战场：Scale-up 网络与铜的宿命

纵向扩展（Scale-up）网络目前完全由“铜”统治 [17:09]。

铜的天然优势： 芯片内部本来就是电信号，用铜不需要任何光电转换，其机架内延迟仅为约 5 纳秒/米（总延迟约 10 纳秒），远快于目前的 CPO [17:17]。

为什么 Scale-up 未来必用 CPO？

因为铜的物理极限（“墙”）要撞上了。当前 224G 还可以靠 PAM4 调制支撑到 2米 [18:51]。但下一代 448G 互联 将被迫使用 PAM6 甚至 PAM8，或者翻倍波特率。这会导致信号极其不稳定、信噪比骤降，铜的传输距离将被迫大幅缩短，连单个机架内部都无法覆盖 [19:14]。

英伟达的破局（从 Blackwell 到 Rubin）：
Blackwell 世代的巨大成功在于 NVL72 机架，它用纯铜背板将 72 张 GPU 连成了一个巨大的“超级单卡” [20:21]。
但在 GTC 2026 上，黄仁勋宣布了 Vera Rubin Ultra NVL576 系统 [21:27]。它采用了“铜+光”的混合 Scale-up 模式：机架内部（NVL72）依然靠铜保持极致延迟，但机架之间，则通过 CPO 光学互联 将 8 个机架完全打通 [21:37]。
这使得 Scale-up 资源池直接扩大到了 576张 GPU，未来的 Kyper 世代甚至将达到 NVL1152 [21:53]。

💡 视频核心总结

视频最后指出，行业的行业准则正在发生改变。过去的原则是“能用铜就用铜，不得不消用光才用光”；而未来的新原则是：“能用铜多久，就压榨它多久，因为物理极限的墙就在眼前” [22:27]。

虽然 CPO 依然存在成本、无法单点维修等挑战，但在 Scale-out 领域它正在稳步渗透 [22:40]。而在 Scale-up 领域，一旦铜在 448G 彻底走入死胡同，CPO 将凭借“能将成千上万张 GPU 融为一体”的恐怖规模化能力（World Size），在瞬间统治整个 AI 算力集群 [23:05]。

DEV Community

AI 数据中心网络演进中铜（Copper）与板载共封装光学（CPO - Co-Packaged Optics）