
- 커서 Composer 2.5가 SWE-Bench Multilingual 79.8%로 Opus 4.7·GPT-5.5와 동급 점수를 내면서, 작업당 비용은 1달러 미만(경쟁사 최대 11달러)으로 떨어졌습니다.
- 마이크로소프트는 Build 2026에서 5B 규모 코딩 모델 MAI-Code-1-Flash를 공개했습니다. 앤트로픽 Haiku급 성능을 더 싸게, 깃허브 코파일럿·VS Code에 기본 탑재했습니다.
- 구글 순다르 피차이는 “에이전트 코딩은 아직 조금 뒤처져 있다”고 인정하고, I/O에서 월 100달러 개발자 요금제로 ‘가성비’ 승부를 걸었습니다.
- Claude Code의 프리미엄 독주 구도가 저가 모델들의 협공으로 흔들리는, 본격적인 ‘코딩 AI 가격 전쟁’이 시작됐습니다.
불과 몇 달 전만 해도 “진짜 일하는 코딩 AI”는 사실상 Claude Code 하나였습니다. 그런데 2026년 6월, 판이 바뀌고 있습니다. 같은 벤치마크 점수를 1/10 가격에 내놓는 모델들이 한꺼번에 쏟아지면서, 개발팀의 ‘AI 청구서’를 다시 계산하게 만드는 변화가 일어나고 있습니다. 핵심은 성능이 아니라 단가입니다.
커서 Composer 2.5 — “같은 점수, 1/11 가격”
이번 가격 전쟁의 방아쇠는 커서(Cursor)가 당겼습니다. 5월 중순 공개된 자체 코딩 모델 Composer 2.5는 오픈소스 Kimi K2.5 체크포인트를 기반으로, 직전 버전 대비 25배 많은 합성 작업으로 학습됐습니다. 컴퓨팅 예산의 85%를 추가 학습과 강화학습에 쏟아부었다는 점이 특징입니다.
벤치마크는 동급, 단가는 한 자릿수 달러
Composer 2.5는 SWE-Bench Multilingual에서 79.8%, CursorBench v3.1에서 63.2%를 기록하며 앤트로픽 Opus 4.7, OpenAI GPT-5.5와 비슷한 수준에 올라섰습니다. 결정적인 차이는 가격입니다. 입력 100만 토큰당 0.50달러, 출력 100만 토큰당 2.50달러로, 같은 작업을 처리할 때 경쟁 모델이 최대 11달러를 쓰는 동안 Composer는 1달러도 채 들지 않습니다. 빠른 변형 모델도 3.00/15.00달러 수준입니다.
Trend Insight — 코딩 AI의 경쟁축이 ‘누가 더 똑똑한가’에서 ‘같은 결과를 누가 더 싸게 내는가’로 옮겨가고 있습니다. 벤치마크 1~2%p 차이보다 토큰 단가 10배 차이가 개발팀 의사결정을 좌우하는 국면입니다.
마이크로소프트 — 자체 모델로 ‘OpenAI 의존’ 줄이기
마이크로소프트는 Build 2026에서 자체 개발한 7종의 MAI 모델군을 한꺼번에 공개했습니다. 이 중 코딩에 특화된 MAI-Code-1-Flash는 50억(5B) 파라미터의 에이전트형 모델로, 회사 측은 “앤트로픽 Haiku급 성능을 더 저렴하게 실행한다”고 설명합니다. 이미 깃허브 코파일럿과 비주얼 스튜디오 코드에 통합돼 있습니다.
추론 모델 MAI-Thinking-1과 ‘1/10 비용’ 전략
함께 공개된 첫 추론 모델 MAI-Thinking-1은 1조 파라미터(활성 350억), 12.8만 토큰 컨텍스트를 갖췄고, 내부 블라인드 비교에서 앤트로픽 Sonnet 4.6보다 선호됐다고 합니다(공개 벤치마크 기준으로는 딥시크 V3.2와 비슷한 수준). 더 주목할 부분은 ‘Frontier Tuning’입니다. 기업이 자사 업무 데이터로 강화학습을 돌려 모델을 맞춤화하면, GPT-5.4급 성능을 약 1/10 비용으로 낼 수 있다는 것이 마이크로소프트의 주장입니다. 맥킨지 테스트에서는 맞춤형 MAI 모델이 가장 높은 승률을 기록했습니다.
Trend Insight — 마이크로소프트의 진짜 무기는 모델 한 종이 아니라 ‘코파일럿+Azure+자체칩(Maia)’으로 이어지는 수직 통합입니다. OpenAI 의존도를 낮추면서 개발자 단가를 끌어내리는 구조 자체가 경쟁사에는 가장 큰 위협입니다.
구글의 인정, 그리고 Claude Code가 마주한 시험대
구글은 솔직했습니다. 순다르 피차이 CEO는 한 인터뷰에서 “툴 사용, 지시 수행, 장기 과제를 다루는 에이전트형 코딩에서는 우리가 지금 조금 뒤처져 있다”고 인정했습니다. 대신 구글은 I/O 2026에서 월 100달러짜리 개발자 구독 요금제를 내세우며 ‘가성비’ 포지션을 택했습니다. 정면 승부 대신 가격과 생태계로 따라붙겠다는 전략입니다.
한국 개발팀은 무엇을 봐야 하나
정리하면 구도는 이렇습니다. 성능 정점에는 여전히 Claude Code와 OpenAI Codex가 있지만, 그 바로 아래를 커서·마이크로소프트·구글이 ‘비슷한 점수, 훨씬 싼 가격’으로 빠르게 메우고 있습니다. 실무 관점에서 중요한 건 한 가지입니다. 일상적인 리팩터링·테스트·보일러플레이트 작성처럼 ‘대량 반복’ 작업은 저가 모델로 돌리고, 복잡한 설계와 장기 과제만 프리미엄 모델에 맡기는 식의 ‘모델 믹스’ 운영이 곧 표준이 될 가능성이 큽니다. 도구를 하나로 고정하기보다, 작업 난이도별로 단가를 최적화하는 역량이 개발팀의 새로운 경쟁력이 됩니다.
Trend Insight — “어떤 코딩 AI가 가장 좋은가”라는 질문은 점점 의미가 옅어집니다. 2026년 하반기의 진짜 질문은 “어떤 작업에 어떤 단가의 모델을 붙일 것인가”입니다. 가격이 무너질수록, 승부는 모델이 아니라 운영 설계에서 갈립니다.
관련 글
출처
- The Decoder — Cursor’s Composer 2.5 matches Opus 4.7 and GPT-5.5 benchmarks at a fraction of the cost
- The Decoder — Build 2026: Microsoft’s MAI models and the cost case
- CNBC — Microsoft and Google take on Anthropic and OpenAI in AI coding models
AI Biz Insider · AI 트렌드 · aibizinsider.com
댓글 남기기