AI가 9개월 만에 칩을 만들었다고?

오픈AI 브로드컴 할라피뇨 추론 칩 개념 이미지
TL;DR
  • 오픈AI가 브로드컴과 함께 첫 자체 추론 전용 칩 ‘할라피뇨(Jalapeño)’를 공개했다. GPU 개조판이 아니라 LLM 추론만을 위해 백지에서 설계한 ASIC이다.
  • 설계 시작부터 테이프아웃까지 단 9개월. 보통 1.5~2년 걸리는 과정을 오픈AI 자사 AI 모델을 설계에 투입해 절반 이하로 줄였다.
  • 외신 분석에 따르면 컴퓨트 다이는 약 840㎟로 EUV 레티클 한계(858㎟)에 육박하며, HBM 모듈 6개를 두른 초대형 패키지다.
  • 2026년 말 마이크로소프트 등 파트너 데이터센터에 초기 배치, 2027년 램프업, 2028년 상반기 본격 확산이 목표다.

챗GPT의 답변 하나하나는 엔비디아 GPU 위에서 만들어진다. 그런데 오픈AI가 이 구조를 바꾸겠다고 선언했다. 6월 24일(현지시간) 오픈AI와 브로드컴이 공개한 첫 자체 추론 칩 ‘할라피뇨’는 단순한 반도체 신제품이 아니다. 설계 기간 9개월이라는 숫자 뒤에는 “AI가 AI를 돌릴 칩을 직접 설계하는” 새로운 사이클이 숨어 있다. 이 칩이 왜 업계의 판을 흔드는지, 세 가지 축으로 정리했다.

챗GPT의 심장을 직접 만들다

범용 GPU가 아닌 ‘추론 전용’ 백지 설계

할라피뇨는 오픈AI가 ‘인텔리전스 프로세서(Intelligence Processor)’라고 부르는 첫 자체 가속기다. 핵심은 훈련용 가속기를 개조하거나 범용 AI 칩을 가져다 쓴 것이 아니라, LLM 추론이라는 단일 목적을 위해 처음부터 새로 설계했다는 점이다. 오픈AI는 챗GPT, 코덱스(Codex), API를 매일 운영하며 쌓은 데이터를 바탕으로 커널, 메모리 이동, 네트워킹, 서빙 패턴 등 추론 병목을 아키텍처 단계에서 최적화했다고 밝혔다.

저렴한 DRAM 대신 HBM을 채택하고 대형 컴퓨트 칩렛을 쓴 것도 의도적이다. 높은 처리량과 낮은 지연시간을 동시에 잡아, 추론(reasoning) 모델과 에이전트 워크로드처럼 왕복이 많은 작업에 대응하겠다는 것이다. 초기 테스트에서는 와트당 성능이 현존 최고 수준 하드웨어를 “상당히 앞선다”는 결과가 나왔고, 엔지니어링 샘플은 이미 목표 클럭과 전력으로 GPT-5.3-Codex-Spark 같은 실제 워크로드를 돌리고 있다.

Trend Insight — 구글 TPU, 아마존 트레이니엄에 이어 오픈AI까지 자체 칩에 뛰어들면서, 프런티어 AI 기업의 경쟁 무대가 ‘모델’에서 ‘모델+실리콘 풀스택’으로 넘어갔다. 추론 비용이 곧 서비스 마진인 시대에, 칩을 가진 쪽이 가격 경쟁의 주도권을 쥔다.


9개월 테이프아웃, 설계자는 AI였다

1.5~2년 걸리던 일을 절반 이하로

고성능 ASIC을 백지에서 설계해 테이프아웃(제조 도면 확정)까지 가는 데는 통상 1.5~2년이 걸린다. 할라피뇨는 이 과정을 9개월에 끝냈고, 오픈AI는 이를 “고성능 첨단 반도체 역사상 가장 빠른 ASIC 개발 사이클”이라고 주장한다. 비결로 지목된 것이 자사 AI 모델의 설계 투입이다. 그렉 브록먼 오픈AI 사장은 “우리 모델이 개발을 가속한 정도가 우리 스스로도 놀라울 수준이었다”고 말했다.

톰스하드웨어는 브로드컴이 여러 커스텀 칩에서 검증된 로직 블록을 재사용하는 방식도 개발 속도에 기여했을 것으로 분석했다. 어느 쪽이든 “사용자에게 서비스 중인 바로 그 모델이, 미래 모델을 돌릴 인프라를 설계한다”는 순환 구조가 실제 실리콘으로 증명된 첫 사례라는 점은 변하지 않는다.

Trend Insight — AI가 칩 설계 기간을 절반으로 줄인다면, 반도체 산업의 세대교체 주기 자체가 짧아진다. EDA(반도체 설계 자동화) 툴 기업과 팹리스의 인력 구조, 그리고 ‘설계 인재 부족’이라는 업계 통념까지 다시 계산해야 할 수 있다.


공개된 사진으로 추정한 스펙

레티클 한계에 육박하는 초대형 다이 + HBM 6개

양사는 상세 스펙을 공개하지 않았지만, 톰스하드웨어가 공개 사진을 분석한 결과 패키지는 대형 컴퓨트 칩렛 1개, HBM 모듈 6개, I/O 칩렛 1개, 더미 다이 2개로 구성된 것으로 보인다. 주변 HBM 패키지 크기(10.975mm 각)를 기준으로 역산한 컴퓨트 다이 크기는 약 25.46mm×33mm, 면적 약 840㎟다. EUV 노광 장비가 한 번에 찍을 수 있는 레티클 한계(858㎟)에 거의 도달한, 물리적으로 만들 수 있는 최대 크기의 칩이라는 뜻이다.

네트워킹에는 브로드컴의 토마호크(Tomahawk) 실리콘이 결합되고, 셀레스티카(Celestica)가 보드·랙·시스템 통합을 맡는다. 주목할 대목은 할라피뇨가 오픈AI 모델 전용이 아니라 “업계의 현재와 미래 LLM 전반”을 지원하도록 설계됐다는 것이다. 공급만 확보된다면 오픈AI가 제3자에게 하드웨어를 판매하는 시나리오도 열려 있는 셈이다.

Trend Insight — HBM 6개를 두른 레티클급 다이는 곧 HBM 수요의 추가 폭증을 의미한다. SK하이닉스·삼성전자·마이크론으로 이어지는 메모리 슈퍼사이클 관점에서, 할라피뇨는 한국 반도체 산업에 직접적인 수혜 신호다.


2026년 말 배치, 엔비디아의 셈법은

기가와트급 데이터센터에서 시작하는 다세대 로드맵

배치 일정은 구체적이다. 2026년 말 마이크로소프트를 포함한 데이터센터 파트너를 통해 초기 배치를 시작하고, 혹 탄 브로드컴 CEO에 따르면 2027년 램프업을 거쳐 2028년 상반기 “풀 틸트(full tilt)”로 확산한다. 할라피뇨는 다세대 플랫폼의 1세대일 뿐이며, 양사는 기가와트 규모 데이터센터 배치를 전제로 후속 세대를 함께 개발 중이다.

물론 이것이 곧바로 ‘엔비디아 탈피’를 의미하지는 않는다. 훈련 워크로드는 여전히 GPU 의존도가 높고, 초기 물량도 제한적이다. 그러나 추론이 AI 컴퓨트 수요의 대부분을 차지해가는 국면에서, 가장 큰 추론 수요자였던 오픈AI가 자체 공급 라인을 확보했다는 사실 자체가 협상력의 구조를 바꾼다. 와트당 성능에 대한 상세 기술 리포트는 수개월 내 공개될 예정이다.

Trend Insight — 국내 기업에 주는 시사점은 두 가지다. 첫째, 추론 비용은 앞으로 계속 떨어진다. AI 도입의 손익분기 계산을 올해 숫자로 고정하지 말 것. 둘째, 특정 GPU 클라우드에 락인된 아키텍처보다, 칩이 바뀌어도 옮겨 탈 수 있는 추상화 계층을 갖춘 설계가 장기적으로 유리하다.


관련 글

출처

  1. OpenAI — OpenAI and Broadcom unveil LLM-optimized inference chip
  2. Tom’s Hardware — Broadcom and OpenAI unveil custom-built Jalapeño inference processor
  3. TechCrunch — OpenAI unveils its first custom chip, built by Broadcom
  4. CNBC — OpenAI and Broadcom reveal Jalapeno, first AI chip in partnership

AI Biz Insider · AI 트렌드 · aibizinsider.com


AI Biz Insider에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

코멘트

댓글 남기기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기