
- 앤스로픽이 가장 강력한 모델 Claude Opus 4.8을 공개했다. 100만 토큰 컨텍스트가 기본 탑재된다.
- 패스트 모드(research preview)로 같은 모델에서 출력 속도를 최대 2.5배까지 끌어올린다.
- 대화 중간 시스템 메시지, 프롬프트 캐시 최소 길이 1,024토큰 등 비용·운영 개선이 핵심이다.
- 장기 에이전트 코딩, 도구 호출 정확도, 컨텍스트 압축 복구가 눈에 띄게 좋아졌다.
2026년의 앤스로픽은 거의 2주에 한 번꼴 모델을 갈아치우고 있다. 그리고 이번에 나온 Claude Opus 4.8은 “또 하나의 업데이트” 정도로 넘기기엔 바뀜 지점이 묘하게 실무적이다. 벤치마크 숫자를 자랑하는 대신, 길게 도는 에이전트 작업과 토큰 비용처럼 현장에서 진짜 돈이 새는 곣을 손봤다. 무엇이 달라졌고, 대표와 개발자는 무엇을 점검해야 하는지 정리했다.
100만 토큰이 ‘기본값’이 됐다
옵션이 아니라 디폴트
Claude Opus 4.8은 앤스로픽이 현재 일반 제공하는 모델 중 가장 강력한 모델로, 복잡한 추론과 장기 에이전트 코딩, 높은 자율성이 필요한 작업을 겨냩한다. 가장 눈에 띄는 변화는 100만(1M) 토큰 컨텍스트 윈도우가 Claude API와 Amazon Bedrock, Vertex AI에서 기본으로 켜진다는 점이다(Microsoft Foundry는 20만). 최대 출력은 12.8만 토큰, 사고 방식은 적응형 사고(adaptive thinking)로 통일됐다.
적응형 사고는 모델이 턴마다 “지금 생각이 필요한가”를 스스로 판단한다. 단순 조회나 짧은 에이전트 스텝에서는 곷장 답하고, 복잡한 다단계 문제에서만 추론을 돌린다. 그 결과 같은 effort 수준에서도 4.7보다 낭비되는 사고 토큰이 줄어든다. 참고로 effort 기본값은 모든 환경에서 high로 설정됐다.
Trend Insight — 100만 토큰이 기본이 된다는 건, 이제 ‘긴 문서를 어떻게 나눠 넣을까’라는 고민 자체가 사라진다는 뜻이다. RAG 청킹에 쇏던 엔지니어링 리소스를 다른 곳에 재배치할 수 있다.
속도와 비용을 동시에 건드렸다
패스트 모드: 같은 모델, 2.5배 속도
Claude API에서 리서치 프리뷰로 제공되는 패스트 모드는 요청에 speed: "fast"를 넣으면 같은 모델에서 초당 출력 토큰을 최대 2.5배까지 높여준다. 대신 프리미엄 가격이 적용된다. 응답 지연이 사용자 경험을 좌우하는 실시간 챗봇이나 코파일러류 제품이라면, 모델을 다운그레이드하지 않고도 체감 속도를 끌어올릴 수 있는 카드가 생긴 셋이다.
대화 중간 시스템 메시지 & 캐시 최소 1,024토큰
Opus 4.8은 사용자 턴 직후에 role: "system" 메시지를 끼워 넣을 수 있다. 긴 대화 도중 지시사항을 갱신할 때 전체 시스템 프롬프트를 다시 쓰지 않아도 되고, 앞 턴의 프롬프트 캐시 적중을 유지하기 때문에 에이전트 루프의 입력 비용이 줄어든다. 여기에 프롬프트 캐시 최소 길이가 4.7의 기준보다 낮은 1,024토큰으로 내려가, 예전엔 너무 짧아 캐싱이 안 되던 프롬프트도 코드 변경 없이 캐시에 올라간다.
Trend Insight — 이번 업데이트의 진짜 메시지는 ‘성능’보다 ‘단가’다. 토큰 비용과 지연 시간은 AI 제품의 손익을 직접 흔드는 변수다. 캐시 적중률 1%가 월 청구서에서 적지 않은 차이를 만든다.
에이전트 코딩이 ‘진짜로’ 달라졌다
길게 돌아도 덜 헤맨다
앤스로픽은 4.7 대비 세 가지 행동 개선을 강조한다. 첫째, 장기 에이전트 코딩에서 긴 컨텍스트 처리가 좋아지고 압축(compaction) 횟수가 줄며 압축 후 복구가 개선됐다. 둘째, 도구 호출(tool triggering)이 정교해져 과제에 꼭 필요한 도구 호출을 빼먹는 사례가 줄었다. 셋째, effort 수준별 추론 보정이 더 일관적이다. 긴 에이전트 트레이스가 압축 이후에도 덜 탈선한다는 것이 핵심이다.
왜 이 속도가 가능한가
배경에는 앤스로픽이 자사 도구로 자사 제품을 만드는 구조가 있다. 외부 분석에 따르면 앤스로픽 엔지니어는 업무의 약 60%를 Claude로 처리하고, 데스크톱 도구 Cowork는 Claude Code로 10일 만에 만들어졌다고 전해진다. 모델이 좋아질수록 다음 모델을 더 빨리 만든다는 자기강화 루프가, 월 단위였던 출시 주기를 주 단위로 압축한 셋이다. 다만 이 수치는 외부 매체 정리이므로 참고용으로 보는 게 안전하다.
Trend Insight — 대표가 점검할 3가지: (1) 우리 에이전트 워크플로가 4.7에 묶여 있다면 effort·적응형 사고 설정을 그대로 두고도 4.8 마이그레이션이 가능한지, (2) 패스트 모드로 UX를 살릴 제품이 있는지, (3) 캐시 정책 재설계로 줄일 수 있는 월 토큰 비용이 얼마인지.
관련 글
- 구글이 24시간 일 시킨다는데…
- 앤스로픽이 머스크에 매달 1.6조
- Anthropic Taught Claude to Dream — Tasks Got 6× Faster
- 콜센터가 사라지고 있습니다…
출처
- Anthropic — What’s new in Claude Opus 4.8 (Claude API Docs)
- TJ Digital — Anthropic’s 2026 Claude Updates: What’s Happening and Why It Matters
AI Biz Insider · AI 트렌드 · aibizinsider.com
댓글 남기기