这视频由知名半导体分析机构 SemiAnalysis 发布,围绕 AI 数据中心网络演进中铜(Copper)与板载共封装光学(CPO - Co-Packaged Optics)的竞争和未来进行了极其硬核且详细的深度拆解。
视频的核心逻辑可分为以下几个关键板块:
一、 背景:铜的物理极限与三大网络层级
1. 铜的物理极限
视频开篇强调,半导体一直依赖铜(如芯片金属层、主板走线、NVL72机架的背板总线)。但当单通道传输速率达到 200 Gbits/second (每路) 及以上时,铜的传输距离极限被死死卡在 2米以内 [00:55]。超过这个距离,现代 AI 服务器的庞大带宽需求就只能依赖光纤和激光 [01:01]。
2. AI 数据中心的三大网络层级 [01:43]
- 前端网络(Front-end Network): 负责基础的数据加载、SSH 访问和用户请求,带宽要求最低 [01:51]。
- 纵向扩展网络(Scale-up Network): 连接单机架内的所有计算和网络托盘(如英伟达的 NVLink),让多张 GPU 能以极高带宽、极低延迟像“单张 GPU”一样协同工作 [02:07]。其带宽需求是 Scale-out 的 10 倍 [03:47]。
- 横向扩展网络(Scale-out Network): 负责机架与机架之间、甚至整个数据中心范围内的服务器互联 [03:00]。其带宽需求是前端网络的 8 到 10 倍 [03:47]。
二、 传统可插拔光模块(Pluggable Transceivers)的致命痛点
在需要跨机架的 Scale-out 网络中,目前行业标配是可插拔光模块(如 OSFP、QSFP-DD) [04:29]。
视频拆解了它的四大组成部分:物理接口、DSP(数字信号处理器)、TOSA(激光发射组件)、ROSA(光接收组件) [05:03]。
视频提出了一个颠覆直觉的事实:耗电和延迟的元凶根本不是激光器(仅占15%功耗),而是 DSP。 [06:06]
为什么必须要 DSP?
因为 GPU 或交换机生成的电信号,在穿过芯片封装、主板走线到达机架边缘的光模块(约 30 厘米距离)时,信号已经严重衰减和失真,必须通过 DSP 进行放大和“清洗” [07:17]。而 CPO 的核心存在意义,就是将光学引擎无限靠近源头,彻底消灭 DSP [06:57]。
三、 从 LPO 到 CPO 的技术演进路径
为了干掉 DSP,行业尝试了多种方案:
- LPO(线性可插拔光模块): 做法很大胆,直接拿掉可插拔模块里的 DSP,强行把失真的电信号转成光信号发出去。虽然有用,但极大牺牲了传输距离 [08:25]。
- OBO(板载光学): 把光模块从机架边缘移到主板上更靠近芯片的位置。但由于距离还不够近,没能彻底干掉 DSP,同时还丢掉了可插拔的便利性,宣告失败 [09:06]。
- NPO(近封装光学): 将光学引擎移至与 ASIC(交换机芯片/GPU)极近的特殊高特性基板上,是目前正在落地的折中方案 [09:38]。
- CPO(共封装光学): 终极形态,将光学引擎与芯片直接封装在同一个 Package 上 [10:01]。
视频中拆解的 CPO 三大阶梯(Tiers):
- 第一阶梯(最低限度): 光学引擎与交换机芯片在同一封装基板上,通过铜走线连接。虽干掉了 DSP,但仍需要 SerDes 进行并行/串行信号转换 [10:31]。
- 第二阶梯(中介层集成): 芯片与光学引擎坐落在同一个硅基或有机中介层(Interposer)上,互连密度大幅提升,彻底不再需要 SerDes,实现完全的并行集成 [11:01]。
- 终极 Boss 级: 利用混合键合(Hybrid Bonding)等 3D 堆叠技术(2.5D 如台积电的 COW-AMH),将光学引擎直接叠在芯片上方或下方,实现极致的低功耗 [11:31]。
四、 CPO 的商业落地博弈:Scale-out 网络
CPO 的首个落地目标是替代 Scale-out 网络中的传统光模块 [12:46]。然而,行业对此产生了严重分歧:
- 传统可插拔的优势: 坏了极易更换(运维成本低);标准统一、供应商极多,大厂拥有极强的价格控制权且能避免供应商锁定(Vendor Lock-in) [13:29]。
- CPO 的软肋: 它是封装级别的。如果你买英伟达或博通的 CPO 芯片,你就必须绑定购买他们的整套光学方案;一旦其中一个通道坏了,你无法单独维修,必须报废更换整个昂贵的交换机 [14:11]。
- 市场现状:
- 超级云巨头(Hyperscalers): 非常看重供应链多样性和价格把控,对全力拥抱 CPO 仍持谨慎态度,甚至在推动 NPO 混合方案 [16:00]。
- 新一代 AI 云(Neoclouds): 更喜欢买来即用的 Turnkey 整体方案,因此对英伟达的 CPO 交换机表现出极高热情 [16:48]。
五、 终极战场:Scale-up 网络与铜的宿命
纵向扩展(Scale-up)网络目前完全由“铜”统治 [17:09]。
- 铜的天然优势: 芯片内部本来就是电信号,用铜不需要任何光电转换,其机架内延迟仅为约 5 纳秒/米(总延迟约 10 纳秒),远快于目前的 CPO [17:17]。
为什么 Scale-up 未来必用 CPO?
因为铜的物理极限(“墙”)要撞上了。当前 224G 还可以靠 PAM4 调制支撑到 2米 [18:51]。但下一代 448G 互联 将被迫使用 PAM6 甚至 PAM8,或者翻倍波特率。这会导致信号极其不稳定、信噪比骤降,铜的传输距离将被迫大幅缩短,连单个机架内部都无法覆盖 [19:14]。
- 英伟达的破局(从 Blackwell 到 Rubin):
- Blackwell 世代的巨大成功在于 NVL72 机架,它用纯铜背板将 72 张 GPU 连成了一个巨大的“超级单卡” [20:21]。
- 但在 GTC 2026 上,黄仁勋宣布了 Vera Rubin Ultra NVL576 系统 [21:27]。它采用了“铜+光”的混合 Scale-up 模式:机架内部(NVL72)依然靠铜保持极致延迟,但机架之间,则通过 CPO 光学互联 将 8 个机架完全打通 [21:37]。
- 这使得 Scale-up 资源池直接扩大到了 576张 GPU,未来的 Kyper 世代甚至将达到 NVL1152 [21:53]。
💡 视频核心总结
视频最后指出,行业的行业准则正在发生改变。过去的原则是“能用铜就用铜,不得不消用光才用光”;而未来的新原则是:“能用铜多久,就压榨它多久,因为物理极限的墙就在眼前” [22:27]。
虽然 CPO 依然存在成本、无法单点维修等挑战,但在 Scale-out 领域它正在稳步渗透 [22:40]。而在 Scale-up 领域,一旦铜在 448G 彻底走入死胡同,CPO 将凭借“能将成千上万张 GPU 融为一体”的恐怖规模化能力(World Size),在瞬间统治整个 AI 算力集群 [23:05]。
Top comments (0)