DEV Community

cognitalk
cognitalk

Posted on

SemiAnalysis访谈Radiant的AIInfra主管PatrickWohlschlegel


https://www.youtube.com/watch?v=SQtavfviwrs&t=1s

在这段由 SemiAnalysis 发布的 GTC 2026 访谈视频中,主持人 Jordan Nanos 对 Radiant 公司的基础设施主管 Patrick Wohlschlegel 进行了深度采访。两人围绕 Radiant 公司的战略定位、吉瓦(Gigawatt)级 AI 算力中心的设计以及如何应对高达 400kW 的 GPU 密集型机架带来的基础设施挑战 展开了详细讨论。

以下是访谈内容的完整且详细的梳理:


一、 Radiant 公司背景与个人介绍

  • 关于 Patrick 和 Radiant: Patrick 拥有近 15 年的超级计算(Hyper Computing)经验,于两年前加入了 Radiant。Radiant 是一家大约在访谈前两周刚刚官宣推出的新型“新云(Neocloud)”风投公司。他在公司担任基础设施主管,主要负责基础设施的路线图、采购、算力部署及运营管理工作。 [00:00:09]

二、 Radiant 的全球路线图与核心支柱

  • 四大核心支柱: Radiant 的业务主要围绕四个关键要素构建:软件平台、算力基础设施、土地资源、以及执行资本[00:01:11]
  • 全球扩展计划: Radiant 计划通过最新的 NVIDIA 架构(包括未来的 Ruben 架构)在多个全球站点填充其算力中心,这些站点总共代表着 数百兆瓦(several hundreds of megawatts) 的潜在电力容量。在 GTC 现场,他们正在密切关注各种配套设备(如 CDU 冷却分发单元等)的行业进展,以组合部署这些集群。 [00:01:11]

三、 突破行业核心瓶颈:与 Brookfield 的合并

  • 传统算力的约束: 过去行业中最核心的限制是获取土地、获取电力以及足够的资本支持[00:02:21]
  • 12个月快速交付: 借由加入 Brookfield AI 基金 并与 Brookfield 合并,Radiant 彻底解决了上述问题。他们可以直接拿到已获得规划许可的“绿地(Greenfield)”站点,并直接利用 Brookfield 拥有的发电厂来确保电力供应。这使他们能够在创纪录的 12 个月内,实现从“一片荒地(dirt)”到“完全投入生产的 AI 数据中心环境”的超快部署。 [00:02:51]
  • 超高功率机架的挑战: 通过与 Brookfield 旗下的数据中心和相关公司深度合作,他们正在为未来 24 至 36 个月的容量做准备。Patrick 特别提到,最早在 2027 年 1 月,行业就会迎来单机架功率高达 400kW 的 GPU 机架,数据中心必须从现在开始协作设计,以确保能承载这种超高密度的基础设施。 [00:03:54]

四、 电力策略:“表后发电”与电网连接

  • 发电 preferences: 在探讨“电网连接(Grid Connected)”与“表后发电(Behind-the-meter Power Generation)”的差异时,Patrick 指出直接连接传统电网的流程通常较慢。而 Brookfield 带来的核心优势正是能够提供 表后直接发电 的能力,这大大加快了他们基础设施的落地速度。 [00:05:00]

五、 全栈软件与多租户灵活性

  • 团队与 Radiant Cloud OS: Radiant 拥有庞大的软件工程团队。其低层平台被称为 Radiant Cloud OS,负责将裸金属基础设施转换为可供使用的算力,支持裸金属服务、虚拟机或 Kubernetes 环境。高层团队则负责数据科学、模型注册表(Model Registry)和推理服务等应用。 [00:05:50]
  • 极致的弹性复用: 无论是服务于一个内部拥有众多团队的大型单一客户,还是服务于多个公有云模式的小型企业客户,Radiant 的软件栈都具备极高的调度灵活性。例如,一个企业客户可能在某段时期需要运行大规模的分布式训练(Training),此时软件会将其一键配置为大集群的批量节点(Slurm 裸金属环境);几周或几个月后,若客户需要切换为推理(Inference)业务,系统能快速将其解构并重新配置,以极高的效率满足不同的弹性算力需求。 [00:07:04]

六、 纵向集成下的高可靠性与 SLA

  • 垂直一体化的观测: 大型 AI 系统造价极其昂贵,宕机造成的损失难以估量。由于 Radiant 将软硬件、电力和数据中心全部垂直整合在“同一个屋檐下”,其 Radiant Cloud OS 软件内置了强大的可观测性(Observability)、日志分析和告警插件。 [00:08:31]
  • 实现高 SLA 承诺: 该系统能够统一捕获从服务器、交换机、机架乃至整个数据中心环境的所有底层数据,并将其转化为可执行的告警,从而能够向企业级客户提供极高标准的可维护性和可用性服务等级协议(SLA)。 [00:09:10]

Top comments (0)