발표 당일에 뚫렸다…

AI 모델 보안 위협을 상징하는 사이버보안 일러스트
TL;DR
  • Anthropic이 ‘공개하기엔 너무 위험하다’며 제한 배포한 Claude Mythos가 발표 당일 해커 그룹에 유출됐다
  • 침투 경로는 놀라울 정도로 단순했다 — Anthropic의 URL 패턴을 추측해 모델 엔드포인트에 직접 접근
  • 별도로 Project Glasswing 파트너사 벤더 환경을 통한 서드파티 침투도 확인됐다
  • 제로데이 181개를 자율 발견하는 AI가 정작 자기 자신은 지키지 못한 아이러니

인류 역사상 가장 강력한 사이버 무기가 될 수 있는 AI를 만들어 놓고, 그 AI를 보관하는 금고 자체가 뚫렸다. 4월 8일 Anthropic이 Claude Mythos Preview를 공개한 바로 그 날, 비인가 그룹이 이 모델에 접근하는 데 성공했다는 Bloomberg 보도가 나왔다. ‘너무 위험해서 일반 공개하지 않겠다’던 모델이 발표 당일 유출된 것이다. 도대체 무슨 일이 벌어진 걸까?

Mythos는 왜 ‘너무 위험한 AI’인가

제로데이 자율 발견의 괴물

Claude Mythos Preview는 Anthropic이 만든 10조 파라미터 규모의 프론티어 모델이다. 이 모델의 핵심 능력은 소프트웨어 취약점을 자율적으로 발견하고, 실제 작동하는 익스플로잇 코드까지 작성하는 것이다. Firefox 벤치마크에서 Mythos는 181개의 작동 가능한 익스플로잇을 작성했고, 추가로 29개에서 레지스터 제어를 달성했다. 이전 AI 모델들의 성공률이 거의 0에 가까웠던 것과 비교하면 차원이 다른 성능이다.

CVE-2026-4747: 서버 완전 장악

Mythos가 발견한 취약점 중 하나인 CVE-2026-4747은 인터넷 어디에서든 인증 없이 서버 전체를 장악할 수 있는 치명적 결함이었다. 한 사례에서는 4개의 취약점을 연쇄적으로 조합해 JIT 힙 스프레이를 작성하고, 렌더러 샌드박스와 OS 샌드박스를 모두 탈출하는 웹 브라우저 익스플로잇을 만들어냈다. 사이버보안 전문가들조차 수개월이 걸릴 작업을 Mythos는 자율적으로 수행한 셈이다.

Trend Insight — Mythos의 등장은 AI 사이버 공격 능력이 ‘이론적 가능성’에서 ‘실증된 위협’으로 전환된 변곡점이다. Cloud Security Alliance는 이를 ‘자율 공격 임계점(Autonomous Offensive Threshold)’ 돌파로 평가했다.


발표 당일, URL 추측만으로 뚫렸다

해커의 접근 경로

Bloomberg가 4월 21일 보도한 바에 따르면, 소규모 비인가 그룹이 Mythos 공개 당일 이 모델에 접근하는 데 성공했다. 방법은 놀라울 정도로 단순했다. Anthropic의 내부 URL 형식에 익숙한 이들이 모델의 온라인 위치를 ‘추측’한 것이다. Fortune지 보도에 따르면, 이들은 Anthropic의 URL 포맷팅 패턴을 기반으로 교육된 추측(educated guess)을 했고, 이것이 적중했다.

서드파티 벤더 환경 침투

더 우려스러운 점은 별도의 침투 경로도 확인됐다는 것이다. 비인가 사용자들이 서드파티 벤더 환경을 통해 Mythos에 접근한 정황이 포착됐다. Project Glasswing에 참여한 파트너사들 — AWS, Apple, Google, Microsoft, NVIDIA 등 빅테크 기업들 — 과 연결된 벤더 네트워크가 또 다른 진입점이 된 것이다.

Trend Insight — AI 모델 보안에서 가장 취약한 고리는 모델 자체가 아니라 ‘접근 관리’와 ‘서드파티 공급망’이었다. 이는 기존 소프트웨어 보안의 고질적 문제가 AI 시대에도 그대로 반복되고 있음을 보여준다.


Project Glasswing과 방어의 딜레마

공격자의 도구를 방어에 쓴다

Anthropic은 Mythos의 위험성을 인지하고 Project Glasswing이라는 방어 프로그램을 런칭했다. 핵심 아이디어는 Mythos의 취약점 발견 능력을 선제적 방어에 활용하는 것이다. AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등 글로벌 주요 기업들이 파트너로 참여하고 있다. 공격자가 악용하기 전에 취약점을 먼저 찾아 패치하겠다는 전략이다.

아이러니한 현실

하지만 이번 유출 사건은 근본적인 질문을 던진다. 제로데이 수천 개를 자율 발견할 수 있는 AI를 보유하면서, 정작 그 AI를 호스팅하는 인프라의 URL 패턴이 추측 가능할 정도로 예측 가능했다는 것이다. Foreign Policy는 이 사건을 ‘사이버 균형(Cyber Calculus)의 변화’로 규정하며, 방어 우위를 위해 만든 도구가 오히려 새로운 공격 벡터를 창출할 수 있다고 경고했다.

Anthropic CEO Dario Amodei는 이 사건에 대해 내부 조사를 진행 중이라고 밝혔지만, 구체적인 피해 범위나 유출된 모델의 활용 여부에 대해서는 아직 공식 발표가 없다. Euronews는 이 사건을 ‘공개하기엔 너무 위험한 AI가 유출된 최초의 사례’로 보도했다.

Trend Insight — AI 모델 보안은 이제 단순한 기술 문제가 아니라 국가 안보 차원의 이슈다. Mythos급 모델이 잘못된 손에 넘어갈 경우, 제로데이 발견과 익스플로잇 작성이 대규모로 자동화될 수 있다. 사이버 공격의 비용 구조 자체가 바뀌는 것이다.


기업이 지금 해야 할 것

이번 사건은 AI를 도입하는 모든 기업에게 세 가지 시사점을 남긴다. 첫째, AI 모델 접근 관리에 제로 트러스트 원칙을 적용해야 한다. URL 패턴 추측으로 접근이 가능해서는 안 된다. 둘째, 서드파티 벤더 보안 감사를 강화해야 한다. 공급망 어디에서든 침입 경로가 열릴 수 있다. 셋째, 위험 모델에 대한 ‘에어갭(air gap)’ 수준의 격리 환경을 고려해야 한다. 인터넷에 연결된 어떤 시스템도 100% 안전하지 않다는 점을 이번 사건이 증명했다.


관련 글

출처

  1. Fortune — A group of users leaked Anthropic’s AI model Mythos by reportedly guessing where it was located
  2. Euronews — Hackers breach Anthropic’s ‘too dangerous to release’ Mythos AI model
  3. The Hacker News — Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws
  4. Foreign Policy — Anthropic’s Claude Mythos Preview Changes Cyber Calculus
  5. Cybersecurity News — Unauthorized Group Gains Access to Anthropic’s Exclusive Cyber Tool Mythos

AI Biz Insider — AI 트렌드 — aibizinsider.com


AI Biz Insider에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

코멘트

댓글 남기기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기