엔비디아, 큰일 났습니다…

앤트로픽이 도입을 협상 중인 마이크로소프트 Maia 200 AI 칩 이미지

TL;DR

앤트로픽이 MS의 자체 AI 칩 Maia 200 도입을 협상 중. 첫 외부 고객 후보로 떠올랐다.
사티아 나델라 발표 기준 Maia 200은 토큰당 30% 더 저렴. 3나노 TSMC 공정.
MS의 50억 달러 앤트로픽 투자가 인프라 매출로 회수되는 구조 완성.
AWS Trainium 100억 달러 계약에 이은 두 번째 ‘탈(脫)엔비디아’ 카드.

앤트로픽이 마이크로소프트의 자체 AI 칩 ‘Maia 200’ 도입을 협상 중이라는 CNBC 보도가 5월 21일 나왔다. 성사되면 MS가 자기 클라우드 밖으로 Maia를 공급하는 첫 사례다. 50억 달러 투자가 인프라 매출로 되돌아오는 구조, 엔비디아 GPU에 묶여 있던 학습 비용 구조, 그리고 AWS·구글 TPU와 벌어졌던 격차가 동시에 흔들리는 한 수다.

30% 싼 칩, 라이벌이 먼저 잡았다

딜의 본질: ‘5B 투자 → 인프라 매출’ 회수 루프

MS는 지난 분기 앤트로픽에 50억 달러를 투자했다. 이번 협상은 그 자금이 단순한 지분이 아니라, MS 클라우드(Azure)와 MS 자체 칩(Maia) 사용으로 다시 흘러들어오는 구조를 완성한다는 의미다. 오픈AI에 부어 넣은 130억 달러가 Azure 컴퓨팅 매출로 회수되는 모델을, 라이벌인 앤트로픽에도 그대로 적용하는 셈이다.

현재 Maia 200은 MS 내부에서 OpenAI의 GPT-5.2를 구동 중이다. 같은 칩으로 Claude까지 돌리게 되면, MS는 사실상 두 프런티어 모델사를 모두 자기 인프라에 묶어두는 데 성공한다.

Maia 200 스펙: TSMC 3나노, 토큰당 30% 절감

Maia 200은 지난 1월 발표된 MS의 2세대 자체 AI 가속기다. TSMC 3나노 공정으로 제조됐고, 나델라 CEO는 4월 실적발표에서 “기존 함대(fleet) 최신 실리콘 대비 토큰당 30% 더 좋은 성능”이라고 못 박았다. 엔비디아 H200·블랙웰 대비 절대 성능이 아니라, ‘같은 1달러로 더 많은 토큰을 뽑는다’는 단가 경쟁력이 핵심이다.

AI Biz Insider 분석 — 30%는 ‘발표 수치’다. 실제 워크로드(특히 학습)에서는 메모리 대역폭·소프트웨어 스택(CUDA 대체)에서 빠지는 부분이 있다. 다만 추론 단계에서 30%가 검증되면, 챗봇·API 단가가 30%까지 떨어질 여지가 생긴다는 의미다.

앤트로픽의 멀티-실리콘 전략

엔비디아 + 구글 TPU + AWS Trainium + (Maia 200)

앤트로픽은 이미 4월 AWS Trainium 칩 10년·1,000억 달러 계약을 체결했다. 여기에 구글 TPU와 엔비디아 H시리즈를 병행 사용 중이고, 영국 칩 스타트업과도 협상 중인 것으로 알려졌다. Maia 200까지 합류하면 앤트로픽은 4개 메이저 실리콘을 동시에 운영하는 유일한 프런티어 랩이 된다.

왜 이렇게까지? Claude 학습 1회분 GPU 수요가 수만~수십만 장 단위로 늘어났는데, 어느 한 공급망에 묶이면 모델 출시 일정이 통째로 인질이 된다. 엔비디아 H100 인도 지연이 2024~2025년 OpenAI·앤트로픽 모두를 흔들었던 학습이 그대로 반영된 것이다.

엔비디아가 진짜 잃는 것

엔비디아 매출의 60% 이상이 클라우드 4사(MS·AWS·구글·메타)에서 나온다. 그런데 그 4사가 모두 자체 칩으로 ‘추론’은 자기 칩, ‘학습’만 엔비디아라는 구조를 만들고 있다. 추론 시장은 AI 비용의 90%로 향하는 곳이고, 거기서 엔비디아의 입지가 무너지면 매출 성장률은 가파르게 꺾인다.

AI Biz Insider 분석 — ‘학습은 엔비디아, 추론은 자체 칩’이 2026년 클라우드 빅4 공통 플레이북이다. Maia 200·Trainium2·TPU v6·MTIA가 모두 같은 시점에 추론 단가 30~40% 절감을 외치고 있다. 1년 안에 API 가격 한 차례 큰 인하가 온다고 봐도 무리가 아니다.

한국 기업이 봐야 할 시그널

Azure에서 Claude를 쓰는 시대

국내 대기업·금융권의 보안 요건은 대부분 ‘데이터가 한 클라우드(주로 Azure 또는 AWS)를 벗어나지 않을 것’이다. Maia 200 위에서 Claude가 돌면, 그동안 ‘Claude는 좋은데 AWS 종속’이라며 망설였던 Azure 고객들이 곧바로 도입 가능해진다. 영업·기획팀이 들고 갈 새로운 카드다.

단가 인하 vs. 락인(lock-in)

2026년 하반기 API 가격 인하 가능성을 미리 반영해 6~12개월짜리 장기 LLM 계약을 끊기 전 협상 카드로 사용하라. 동시에, 추론을 자체 칩 위에 올리면 그만큼 마이그레이션 비용이 커진다. 단가만 보고 한 클라우드에 묶이면, 다음 사이클 협상력이 사라진다.

국내 NPU·반도체주에 미치는 파장

SK하이닉스 HBM, 삼성전자 파운드리 모두 단기 직격탄은 없다. Maia 200도 HBM·3나노를 쓴다. 다만 ‘엔비디아 단일 고객 의존도’는 분산 효과가 있다. 클라우드 빅4 자체 칩 확산은 K-반도체 입장에선 ‘판 자체가 더 커지는’ 시나리오에 가깝다.

출처

AI Biz Insider · AI 비즈니스 · aibizinsider.com

엔비디아, 큰일 났습니다…

30% 싼 칩, 라이벌이 먼저 잡았다

딜의 본질: ‘5B 투자 → 인프라 매출’ 회수 루프

Maia 200 스펙: TSMC 3나노, 토큰당 30% 절감

앤트로픽의 멀티-실리콘 전략

엔비디아 + 구글 TPU + AWS Trainium + (Maia 200)

엔비디아가 진짜 잃는 것

한국 기업이 봐야 할 시그널

Azure에서 Claude를 쓰는 시대

단가 인하 vs. 락인(lock-in)

국내 NPU·반도체주에 미치는 파장

관련 글

출처

이 글 공유하기:

이것이 좋아요:

AI Biz Insider에서 더 알아보기

코멘트

댓글 남기기응답 취소

더 많은 게시물

OpenAI Spent $4B. Microsoft Just Spent $1B to Beat It.