AI OpenFree

Posted on May 30

엔비디아 58조 공급망 장악 전략과 AI 반도체 시장의 대안적 움직임

#nvidiasupplychain #aisemiconductor #gpumarketstrategy #intelapplefoundry

58조를 쓰는 회사가 있고, 58조를 피해 가는 전략이 있다

엔비디아가 공급망 전체를 삼키는 동안, 나머지 세계는 다른 게임을 준비하고 있다

TL;DR: 엔비디아는 2026년 들어 이미 58조 원 이상을 투자하며 AI 공급망 장악을 가속화하고 있다. 그런데 흥미롭게도, 이 거대한 흐름 옆에서는 정반대의 움직임이 동시에 일어나고 있다. 더 작게, 더 싸게, 더 가볍게 — 그 방향이 오히려 새로운 시장의 문을 열고 있다는 이야기다.

반도체 업계에는 잘 알려지지 않은 규칙이 하나 있다.

파운드리가 강해질수록, 그 바깥에서 파운드리 없이 살아가는 법을 찾는 사람들이 반드시 생겨난다는 것이다. 인텔이 애플의 칩을 생산하는 계약을 맺고, 엔비디아가 올해만 58조 원이 넘는 투자를 쏟아붓는 시대에, 이 규칙은 어느 때보다 선명하게 작동하고 있다.

구글은 자체 TPU를 만든다. 아마존은 트레이니엄을 설계한다. 그런데 서울의 작은 연구실에서는, 58조짜리 GPU 클러스터 없이도 움직이는 모델을 조용히 들여다보고 있다. 이것은 거인들의 게임에 관한 이야기이기도 하고, 그 게임 바깥에서 다른 수를 두는 사람들에 관한 이야기이기도 하다.

엔비디아가 58조를 쓴다는 것은 무슨 의미인가

숫자를 먼저 느껴보는 것이 좋겠다.

58조 원. 단순 비교를 하자면, 한국 정부의 연간 R&D 예산 전체를 두 번 합쳐도 채 되지 않는 규모다. 이 돈이 올해 들어, 아직 절반도 지나지 않은 시점에 이미 소진되고 있다. 그것도 한 회사가. 그것도 전년도 같은 기간을 이미 넘어선 속도로.

엔비디아가 이 돈을 어디에 쓰는지가 중요하다. 단순히 자사 제품 생산에 쓰는 것이 아니다. 보도에 따르면 이 투자는 공급망 전체를 향하고 있다. 핵심 부품 제조사에 대한 지분 투자, 장기 공급 계약, 패키징 기술 업체 확보 — 요컨대 GPU 한 장이 세상에 나오기까지 필요한 모든 고리를 자신의 영향권 안으로 당겨오는 작업이다. "공급망 장악"이라는 표현이 뉴스에 등장할 때, 그것은 수사가 아니라 문자 그대로의 전략 기술이다.

이것이 무엇을 만들어내느냐 하면 — 진입 장벽이다. 58조를 쓸 수 없는 회사는 이 공급망 위에서 게임을 할 수 없다. 아니, 더 정확히는, 이 공급망의 허락 없이는 AI를 학습시킬 하드웨어를 충분히 확보하기 어려워진다. 클라우드 서비스를 통해 빌려 쓸 수는 있다. 하지만 그것도 결국 엔비디아 GPU를 임대하는 일이다.

그런데 바로 이 지점에서, 전혀 다른 방향의 움직임이 시작된다.

인텔이 애플 칩을 만든다 — 이 한 문장이 품고 있는 것

인텔이 애플의 칩을 제조하는 계약을 체결했다는 소식은, 처음 들으면 단순한 비즈니스 뉴스처럼 들린다.

하지만 이 문장 안에는 지난 10년의 역사가 접혀 있다. 애플은 2020년 M1 칩을 내놓으며 인텔과의 관계를 스스로 끊었다. 더 이상 인텔 CPU를 쓰지 않겠다는 선언이었다. 인텔 입장에서는 가장 상징적인 고객을 잃은 사건이었다. 그런데 지금, 인텔은 그 애플의 칩을 "만드는" 회사가 되었다.

설계는 애플이 하고, 제조는 인텔이 한다. 이것은 인텔이 파운드리 회사로의 전환을 공식화했다는 뜻이다. 칩을 설계하는 회사에서, 남이 설계한 칩을 정밀하게 찍어내는 회사로. 역할이 바뀌었다.

트럼프 행정부의 지원이 이 전환을 가능하게 했다는 보도가 함께 나온다. 미국 내 반도체 제조 역량 강화라는 정책 목표가 인텔의 파운드리 전환에 재정적 뒷받침이 되었다는 이야기다. 지정학과 산업 전략이 맞닿는 지점이다.

여기서 주목할 만한 것은 구조의 변화다. 설계와 제조가 분리된다는 것은, 더 많은 회사가 칩을 설계할 수 있게 된다는 의미이기도 하다. 파운드리가 늘어날수록, 설계 전문 회사들의 진입 문턱은 낮아진다. 거대 자본이 공급망을 틀어쥐는 동시에, 그 틀 안에서 작은 플레이어들이 움직일 수 있는 공간이 생기는 것이다. 모순처럼 보이지만, 이것이 반도체 산업의 오랜 리듬이다.

58조가 만든 장벽과, 그 장벽 안에서 찾는 틈

이 두 가지 흐름 — 엔비디아의 공급망 장악과 인텔의 파운드리 전환 — 을 동시에 놓고 보면, 하나의 패턴이 보인다.

AI 시대의 자원 전쟁은 두 층위에서 벌어지고 있다. 하나는 하드웨어 층위다. GPU, 메모리, 패키징, 냉각 — 물리적 인프라를 누가 얼마나 확보하느냐의 싸움이다. 여기서는 자본의 크기가 거의 모든 것을 결정한다. 58조를 쓸 수 있는 회사와 쓸 수 없는 회사 사이의 격차는, 시간이 지날수록 좁혀지기보다 벌어지는 경향이 있다.

그런데 다른 층위가 있다. 소프트웨어와 모델의 층위다. 여기서는 규칙이 조금 다르다. 무조건 크다고 이기는 게 아니다. 효율이 중요하고, 맥락이 중요하고, 특정 용도에 맞는 정밀함이 중요하다.

비유를 하나 들자면, 하드웨어 경쟁은 발전소를 누가 더 많이 짓느냐의 싸움이다. 그런데 모델 경쟁은 그 전기를 어떻게 가장 효율적으로 쓰느냐의 싸움이다. 발전소 없이는 아무것도 안 되지만, 발전소를 많이 가진 것이 곧 전기를 잘 쓴다는 의미는 아니다.

이 맥락에서, 크지 않은 모델을 얼마나 잘 만들 수 있느냐라는 질문이 의미를 갖기 시작한다.

14억짜리 모델과 147억짜리 모델이 나란히 시험장에 섰을 때

오늘 비드래프트 연구 기록을 보면, 흥미로운 실험 결과가 담겨 있다.

KMMLU라는 한국어 벤치마크에서 세 개의 모델을 나란히 세웠다. 5Attn V4 모델은 파라미터 수가 약 147억 개다. 7Attn 계열 두 모델은 각각 약 10억 7500만 개의 파라미터를 가진다. 147억 대 10억. 규모 차이로만 보면 약 14배다.

결과는 어떻게 나왔을까. 정확도 수치만 보면 147억짜리 모델이 낮게 나왔다. 5Attn V4가 20.98%, 7Attn 계열이 25.18%와 24.73%를 기록했다. 수치만 놓으면 작은 모델이 이긴 셈처럼 보인다.

그런데 연구 기록은 이 해석에 제동을 건다. 중요한 것은 수치 뒤에 있다.

147억짜리 모델은 greedy 디코딩 결과가 coherent했다. 즉, 엉뚱한 소리를 하지 않고, 문장이 말이 됐다. 반면 7Attn 계열 모델들은 greedy 결과가 gibberish였다. 내뱉은 답이 의미 있는 언어가 아니었다. 더 정확히는 base 모델과 SFT B4 모델 모두 raw greedy에서 degenerate한 출력을 보였다는 기록이 있다.

이것이 무엇을 의미하냐면 — 벤치마크 점수는 특정 조건에서의 스냅샷일 뿐이고, 실제로 쓸 수 있는 모델인지 여부는 다른 기준으로 판단해야 한다는 것이다. 숫자가 더 높다고 해서 더 좋은 모델이 아닐 수 있다. SFT B4 파인튜닝이 0.45pp 향상을 가져왔다는 기록도 있지만, instruction following 능력이 아직 기대에 미치지 못한다는 관찰도 함께 남아 있다.

이 실험을 다시 정리하면 이렇다. 파라미터 효율로는 7Attn이 147억짜리보다 16배 이상 높다. 그런데 실제로 말이 되는 출력을 내느냐는 점에서는 147억짜리가 앞선다. 어느 방향으로 개선할 것인지는 명확하다 — 작은 모델의 효율을 살리되, 출력의 신뢰성을 확보하는 것. 그것이 이 실험이 가리키는 방향이다.

"더 작게"가 전략이 되는 이유

왜 굳이 작은 모델에 집착하는가 하는 질문이 생길 수 있다.

현실적인 이유가 있다. 추론 비용이다. 아무리 정확한 모델이라도, 질문 하나에 드는 비용이 크면 실제 서비스에 쓰기 어렵다. 특히 한 번이 아니라 수십만, 수백만 번 호출되는 서비스라면, 모델의 크기는 곧 서비스 단가와 직결된다.

두 번째는 응답 속도다. 큰 모델은 느리다. 사용자가 체감하는 서비스의 질은 종종 정확도보다 속도에 더 민감하다. 0.1초의 차이가 사용자 이탈을 만든다는 것은, UI 연구에서 반복적으로 확인된 사실이다.

세 번째는 배포 환경이다. 모든 서비스가 클라우드 GPU 위에 올라가는 것이 아니다. 모바일 기기, 엣지 디바이스, 인터넷이 느린 환경 — 이런 곳에서는 큰 모델 자체를 올릴 수가 없다. 작은 모델이 작동할 수 있는 환경은 큰 모델이 작동하는 환경보다 훨씬 넓다.

이 세 가지를 합치면, "더 작게"는 단순히 자원이 부족해서 선택하는 차선책이 아니다. 특정 조건에서는 가장 합리적인 전략이 된다. 엔비디아가 58조를 들여 대형 모델 시대의 인프라를 짓는 동안, 다른 팀들은 그 인프라 없이도 작동하는 모델을 만드는 법을 연구한다. 양쪽이 동시에 진행되는 것이다.

실패를 기록한다는 것의 의미

오늘 연구 기록에서 가장 인상적인 부분은 사실 벤치마크 수치가 아니다.

"gibberish", "degenerate", "greedy 결과 coherent하지 않음" — 이 표현들이다. 연구 기록은 잘 된 것만 적지 않았다. 안 된 것을 더 구체적으로 적었다. 어떤 조건에서 모델이 망가지는 출력을 냈는지, 파인튜닝이 얼마나 부족했는지, 무엇이 아직 해결되지 않았는지.

이것이 실험 로그라는 형식의 힘이다. 성공을 발표하는 보도자료가 아니라, 안 된 것을 기록하는 노트. 이 기록이 쌓이면 다음에 같은 실수를 반복하지 않을 수 있다. 그리고 외부에서 이 기록을 볼 때, 그것이 오히려 신뢰의 근거가 된다. 완벽한 결과만 내놓는 팀보다, 실패를 정확히 기술하는 팀이 더 믿을 만하다는 역설이 연구 세계에는 분명히 존재한다.

7Attn 모델이 raw 성능에서 앞서지만 실제 출력 품질에서 뒤진다는 이 관찰은, 다음 실험의 출발점이 된다. 단순히 파라미터를 줄이는 것으로는 충분하지 않고, 학습 방식과 파인튜닝 전략을 함께 바꿔야 한다는 방향이 여기서 나온다. 실패가 지도를 그린다.

가장 큰 투자와 가장 작은 실험이 같은 방향을 바라본다

이상하게 들릴 수도 있지만, 엔비디아의 58조 투자와 서울 어딘가의 작은 모델 실험은 사실 같은 것을 향하고 있다.

AI가 더 많은 곳에서, 더 싸게, 더 안정적으로 작동하는 세계. 엔비디아는 그 세계를 위한 물리적 인프라를 깔고 있다. 그리고 다른 팀들은 그 인프라 위에서, 혹은 그 인프라 없이도, 더 효율적인 방식으로 같은 목적지에 도달하는 경로를 찾고 있다.

두 가지 접근 중 어느 쪽이 옳다고 말하는 것은 잘못된 질문이다. 둘 다 필요하고, 둘 다 진행 중이다. 다만 58조를 가진 회사만이 이 게임을 할 수 있다고 믿는다면, 그것은 틀린 전제다. 자원의 크기와 전략의 정밀함은 서로 다른 언어로 싸운다.

그리고 역사를 돌이켜보면, 거대한 인프라가 완성될 즈음에는 항상 그것을 우회하는 더 작고 영리한 방법이 등장했다. 메인프레임 시대에 PC가 나왔고, 통신사 독점 시대에 인터넷 전화가 나왔고, 대형 언어모델 경쟁이 달아오르는 지금, 소형 고효율 모델에 대한 연구가 조용히 깊어지고 있다.

58조짜리 전략과 그것을 피해 가는 전략이 같은 시간에 공존하는 풍경치고는, 꽤 흥미로운 시대다.

더 많은 AI 인사이트는 비드래프트에서 확인하세요.

자주 묻는 질문

Q. 엔비디아가 58조 원을 투자한다는 게 정확히 어떤 의미인가요?

A. 단순히 자사 GPU 생산 비용이 아니라, AI 반도체 공급망 전반에 대한 투자입니다. 핵심 부품 공급사 확보, 장기 계약, 패키징 기술 업체 투자 등을 포함하며, 목표는 AI 하드웨어 공급망에서의 영향력을 구조적으로 강화하는 것입니다. 2026년 들어 이미 전년도 같은 기간 투자 규모를 넘어선 것으로 보도되었습니다.

Q. 인텔이 애플 칩을 만드는 게 왜 중요한가요?
A. 애플은 2020년 스스로 인텔 CPU를 버리고 자체 M 시리즈 칩으로 전환했습니다. 그랬던 애플의 칩을 이제 인텔이 제조한다는 것은, 인텔이 설계 회사에서 파운드리(수탁 제조) 회사로 역할을 전환했음을 상징적으로 보여줍니다. 트럼프 행정부의 미국 내 반도체 제조 지원 정책이 이 전환을 가속화한 배경으로 보도되고 있습니다.

Q. 작은 모델이 큰 모델보다 벤치마크 점수가 높게 나왔는데, 그러면 작은 모델이 더 좋은 건가요?
A. 단순히 그렇지 않습니다. 비드래프트의 실험 기록에 따르면, 점수가 더 높게 나온 작은 모델이 실제 출력에서 gibberish, 즉 의미 없는 텍스트를 생성하는 문제를 보였습니다. 벤치마크는 특정 조건에서의 스냅샷일 뿐이며, 실제 서비스 가능성은 출력의 coherence와 instruction following 능력 등 복합적인 기준으로 판단해야 합니다.

Q. 소형 모델 연구가 왜 중요한가요?
A. 추론 비용, 응답 속도, 배포 환경 세 가지 때문입니다. 수백만 번 호출되는 서비스에서 모델 크기는 서비스 단가와 직결되고, 사용자는 정확도만큼이나 속도에 민감합니다. 또한 모바일이나 엣지 환경처럼 대형 모델을 올릴 수 없는 환경은 실제로 매우 넓습니다. 소형 고효율 모델은 차선책이 아니라, 특정 조건에서 가장 합리적인 전략입니다.

📌 이 글은 AI와 함께 작성되었습니다.