DEV Community

jidong
jidong

Posted on

Nvidia GTC 2026 프리뷰: Rubin GPU·NemoClaw·CPU 전략, 에이전틱 AI 시대의 인프라 판이 바뀐다

3만 명이 산호세로 온다. 190개국에서. 3월 16일 젠슨 황이 SAP 센터 무대에 선다. 그리고 올해 GPU 컨퍼런스에서 가장 큰 이야기는 GPU가 아닐 수 있다.

Nvidia GTC 2026은 3월 16~19일 산호세에서 열린다. 컨퍼런스의 무게중심이 옮겨졌다. Blackwell 다음 세대인 Rubin GPU 아키텍처가 공식 등장하지만, 전체 주제는 에이전틱 AI—스스로 행동하는 시스템—다. 채팅 모델에 대한 추론과는 다른 하드웨어 트레이드오프가 필요하다.

Rubin: 차세대 GPU 아키텍처

Rubin은 Blackwell을 잇는 Nvidia의 차세대 GPU다. 초기 사양에 따르면 HBM4 메모리를 최대 288GB까지 장착한다. Blackwell 구성 대비 대폭 늘어난 수치다.

HBM4가 중요한 이유가 있다. 에이전틱 워크로드는 모델이 긴 컨텍스트 윈도우를 유지하면서 여러 번의 도구 호출을 처리해야 한다. 이건 학습 워크로드와는 다른 방식으로 메모리 대역폭을 소비한다. Vera Rubin 마이크로아키텍처는 이 HBM4 대역폭을 기반으로 더 높은 연산 처리량을 제공하도록 설계됐다.

이번 주 발표된 Groq와의 라이선스 딜도 맥락이 있다. Groq의 칩 설계는 저지연 추론에 특화됐는데, Nvidia가 이를 라이선스했다는 건 모든 워크로드를 GPU로 처리하는 대신 계층화된 추론 스택을 구축하겠다는 의도다.

NemoClaw: Nvidia가 에이전트 플랫폼 시장에 진입한다

전략적으로 더 흥미로운 발표는 NemoClaw다. 기업용 오픈소스 AI 에이전트 플랫폼으로 알려진 이 제품이 GTC에서 공식 확인되면, Nvidia는 하드웨어 레이어를 넘어 애플리케이션 레이어로 진입하는 셈이다.

논리는 명확하다. H200 클러스터를 사서 LLM을 돌리는 기업들은, 그 모델을 내부 시스템에서 실제 행동을 취하는 에이전트로 오케스트레이션하는 데도 돈을 쓴다. 지금은 LangChain, Microsoft Copilot Studio, 혹은 자체 파이프라인으로 이 오케스트레이션을 한다. Nvidia 네이티브 오픈소스 에이전트 플랫폼이 나오면, Nvidia 실리콘에서 추론 성능 이점을 그대로 가져오는 대안이 생긴다.

오픈소스로 푸는 이유도 있다. CUDA에서 배운 전략이다. 개발자에게 깊이 통합된 무료 툴체인을 제공하고, 가장 쉬운 선택지로 만들면, 워크로드가 스케일될 때 하드웨어 수익이 따라온다.

CPU 피벗—GPU 회사가 CPU를 이야기한다

CNBC의 GTC 프리뷰 보도에서 흥미로운 부분이 있다. 젠슨 황이 에이전틱 AI용 특화 CPU에 키노트 시간을 상당히 할애할 것으로 예상된다는 점이다. CUDA 이후로 GPU 퍼스트 정체성을 가져온 Nvidia가 CPU를 강조하는 건 이례적이다.

아키텍처적으로 이유가 있다. 에이전틱 AI는 루프로 작동한다. 모델이 추론하고, 도구를 호출하고, 결과를 처리하고, 다시 추론한다. GPU 헤비 추론 단계는 그 루프의 일부일 뿐이다. 오케스트레이션, 메모리 관리, 도구 호출 처리는 CPU에서 돌아간다. 에이전트가 주된 AI 배포 패턴이 된다면—현재 기업 채택 곡선이 그 방향을 가리킨다—CPU 아키텍처가 실질적 병목이 된다.

Nvidia가 이 공간에 들어온다는 건, CPU를 단순한 인프라 노이즈가 아니라 의미 있는 수익 기회로 보고 있다는 신호다.

GTC가 올해 의미하는 것

GTC는 전통적으로 Nvidia가 향후 18개월의 GPU 로드맵을 제시하는 자리였다. 올해는 그보다 넓어 보인다. 하드웨어(Rubin), 소프트웨어(NemoClaw), 실리콘 파트너십(Groq)을 함께 묶어 "에이전틱 AI 시대의 Nvidia 네이티브 인프라"가 무엇인지 정의하는 플랫폼 발표다.

가장 주의 깊게 보는 곳은 GPU 클러스터를 구매하는 하이퍼스케일러만이 아니다. 다년간의 조달 결정이 잠기기 전에 어떤 하드웨어 스택을 표준으로 삼을지 정해야 하는 기업들이다.


참고 링크

Top comments (0)