블로그

  • Bezos Just Bet $320M That Gamers Can Train Robots

    Video game controllers linked to a robotic quadruped in an office, illustrating world model AI training
    KEY TAKEAWAYS
    • General Intuition raised a $320M Series A at a $2.3B post-money valuation, led by Khosla Ventures with Jeff Bezos and Eric Schmidt joining.
    • The startup trains world models and action models on hundreds of millions of hours of gameplay footage from its sister app, Medal.
    • A quadruped robot navigated an unfamiliar office after just eight minutes of real-world fine-tuning data.
    • Total disclosed funding now reaches $454M, and a Series B is reportedly already underway.

    While most AI labs are burning cash to collect slow, expensive real-world robotics data, a startup spun out of a gaming-clips app just convinced Jeff Bezos, Eric Schmidt, and Vinod Khosla that the shortcut has been sitting inside video games all along. On June 25, General Intuition announced a $320 million Series A at a $2.3 billion valuation, a bet that the button presses of millions of gamers can teach machines to move through the physical world.

    The $320M Bet on Gameplay Data

    From game clips to a $2.3B valuation

    General Intuition confirmed a $320 million Series A led by Khosla Ventures, with General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg, and researchers from Google DeepMind and MIT joining. The round brings total disclosed funding to $454 million, after a $134 million seed at launch last October. Axios reports the company is already raising a Series B. The startup was spun out of Medal, founder Pim de Witte’s platform where gamers upload and share clips, providing a library of hundreds of millions of hours of gameplay as its founding dataset.

    Business Insight — The valuation tripled in eight months not on the strength of a shipping product, but on a dataset no competitor can simply buy. In the AI arms race, proprietary data is becoming the durable moat while the models themselves commoditize.


    Why Action Labels Beat Raw Video

    The key ingredient is not the footage itself, but the action labels embedded in it: exact records of which buttons a player pressed and when. Most rivals try to infer actions from video alone, which de Witte argues is insufficient. General Intuition builds two model types in parallel, world models that predict how an environment will evolve given an action, and action models that generate the best action given what they can observe. In a live demo, a quadruped robot circled a reporter and explored an unfamiliar office after just eight minutes of real-world fine-tuning, using data collected on the street rather than in that office.

    Business Insight — Labeled cause-and-effect data that pairs an input with its outcome is far scarcer, and more valuable, than raw video. Companies sitting on logs of user actions such as clicks, keystrokes, and workflows may be holding training assets they have never priced.


    The Data Flywheel and Its Limits

    Selling the model, not the car

    De Witte wants General Intuition to be an ecosystem enabler like OpenAI or Anthropic. As he puts it, the company will not build a self-driving car company; it will make it ten times easier for the next person to build one. The bulk of the round funds compute through a deal with CoreWeave, with an API opening by late summer. The company plans to pick customers who can feed it novel real-world data, building a flywheel. It also launched Nerve, a marketplace paying gamers for data labeling and eventually robot teleoperation, and has drawn an ethical line that no agents will be used to harm humans.

    Business Insight — The open question is whether simulation-to-reality transfer holds at scale, something no one has proven yet. For enterprises, that means watching the API launch closely before betting operations on game-trained agents.


    The Bottom Line for Business

    For now, General Intuition is a research bet with striking demos and a generational-company thesis. Khosla frames the emergence of intuition in world models as the next quantum leap after reasoning arrived in large language models. If gameplay really is a scalable shortcut to embodied AI, the winners in robotics and simulation may be decided less by algorithms than by who controls the richest behavioral data. Companies exploring physical automation should track when the API ships and which embodiments, from drones to quadrupeds to factory digital twins, it proves out first.


    Related

    Sources

    1. TechCrunch — General Intuition’s $2.3B bet that video games can train AI agents for the real world
    2. Axios — General Intuition raises $320 million to develop AI from gaming

    AI Biz Insider · AI Business EN · aibizinsider.com

  • 브라우저에 쿠버네티스 띄웠다고?

    브라우저 속 쿠버네티스, 디자인 시스템 컨텍스트, 오픈소스 코드 리뷰를 상징하는 그린 톤 개발자 일러스트
    DIGEST
    • 쿠버네티스를 브라우저에서 — ngrok의 webernetes, 핵심 구성요소를 TypeScript로 10만 줄 넘게 포팅
    • Atlassian이 공개한 DESIGN.md — AI가 만든 ‘slop’ UI를 브랜드에 맞추는 이식형 컨텍스트 포맷
    • Godot, AI 작성 코드 기여 전면 금지 — 오픈소스 유지보수의 새로운 딜레마

    터미널도, 서버도 없이 브라우저 탭 하나에서 쿠버네티스 클러스터가 돌아간다면 믿으시겠어요? 이번 주 GeekNews를 달군 세 소식은 공교롭게도 하나의 질문으로 모입니다 — ‘코드를 누가, 얼마나 이해하고 짜는가.’ 브라우저로 옮겨진 쿠버네티스, AI 시대의 디자인 컨텍스트, 그리고 AI 코드 기여를 막아선 오픈소스 진영까지, 개발자라면 그냥 지나칠 수 없는 세 가지 흐름을 정리했습니다.

    쿠버네티스가 브라우저 안에서 돌아간다 — webernetes

    10만 줄 규모, 그 대부분을 LLM이 썼다

    ngrok의 엔지니어가 공개한 webernetes는 쿠버네티스의 핵심 구성요소를 TypeScript로 다시 구현해 브라우저 안에서 클러스터를 실행합니다. WebAssembly로 통째로 컴파일한 방식이 아니라 kubelet 일부, 스케줄러, kube-proxy, deployment 컨트롤러, 브라우저용 CNI와 컨테이너 런타임을 새로 포팅했습니다. 덕분에 gzip 기준 약 140KiB로 가볍습니다(같은 조건의 Go ‘hello world’ WASM이 약 540KiB인 것과 대비됩니다). 목적은 프로덕션 배포판이 아니라 ‘인터랙티브 쿠버네티스 학습 콘텐츠’입니다. 실제 이미지 레지스트리 대신 TypeScript API로 이미지를 정의하고, 데모의 파란 점으로 Pod 간 통신을 시각화합니다. 첫 커밋 이후 약 2개월간 552개 커밋, 629개 파일, 12만 6천여 줄로 자랐고, 코드 대부분은 Codex와 Claude 같은 LLM이 작성했습니다.

    Tech Insight — 저자는 LLM을 믿되 맡기진 않았습니다. 모든 코드를 직접 리뷰하고, k3s와 동일한 테스트를 돌리는 통합 테스트 204개와 쿠버네티스 Go 코드베이스에서 옮긴 단위 테스트 1,855개로 검증했죠. LLM은 LRU 캐시를 그냥 Map으로 축약하거나 table test 케이스를 슬쩍 빼먹는 실수를 반복했습니다. 저자의 결론은 명확합니다 — ‘2026년엔 사람 동료에겐 좋은 작업을 기대하지만, LLM에겐 좋은 작업을 하지 않으리라 가정하는 편이 안전하다.’ 속도는 LLM이, 취향과 검증은 사람이 맡는 조합이 핵심입니다.


    AI가 만든 UI는 왜 다 비슷할까 — Atlassian DESIGN.md

    브랜드 ‘slop’을 막는 이식형 컨텍스트 파일

    AI에게 UI를 맡기면 그라디언트 버튼, 대문자 제목, 뻔한 카드 레이아웃, 불필요한 호버 애니메이션이 반복됩니다. 디자인 커뮤니티는 이런 결과물을 ‘slop’이라 부릅니다. 원인은 브랜드와 컴포넌트에 대한 컨텍스트 부재 — ‘Generic in, generic out’이죠. Atlassian은 구글이 자사 Stitch 도구를 위해 만든 오픈소스 포맷 DESIGN.md를 자사 디자인 시스템에 적용해 실전 테스트했습니다. DESIGN.md는 기계가 읽는 디자인 토큰과, 사람과 에이전트가 읽는 디자인 근거(rationale) 두 부분으로 구성되며, 시스템의 전체 명세가 아니라 ‘의도(intent)’를 담습니다. Team ’26 키노트 데모에서 Figma Make로 대시보드를 한 번에 생성했더니, 색상과 간격, 형태, 타이포그래피가 Atlassian답게 정렬되는 결과를 얻었습니다.

    Tech Insight — 다만 프로덕션에서는 트레이드오프가 컸습니다. 자체 MCP 서버·skills를 쓸 때와 비교해 토큰을 약 92% 더 소비했고, 실행 간 토큰 소비 편차가 2.7배에 달했습니다. MCP는 필요한 컴포넌트 지침만 온디맨드로 불러오지만, DESIGN.md는 매번 파일 전체를 로드하기 때문입니다. Atlassian의 결론은 균형 잡혀 있습니다 — DESIGN.md는 크로스 플랫폼 이식, 고객 테마링, 낯선 환경에서의 빠른 프로토타이핑에 강한 ‘보완재’이지, 풍부한 디자인 시스템 도구의 대체재는 아니라는 것입니다.


    Godot, AI가 짠 코드는 받지 않는다

    리뷰 부담이 오픈소스를 지치게 하다

    Slay the Spire 2 등에 쓰이는 인기 오픈소스 게임 엔진 Godot가 기여 정책을 개정해, AI가 작성한 코드와 AI 에이전트가 제출한 Pull Request, 그리고 사람 간 소통에 낀 AI 생성 텍스트를 명시적으로 거부하기로 했습니다. 2월부터 쏟아진 ‘AI slop PR’이 이미 지친 유지보수자들을 ‘점점 더 소모적이고 사기를 꺾는’ 상태로 몰아넣었기 때문입니다. Godot Foundation의 표현은 단호합니다 — ‘AI는 책임을 질 수 없고, AI를 많이 쓰는 사람이 자기 코드를 고칠 만큼 충분히 이해한다고 신뢰할 수 없다.’ 다만 사람이 쓴 원문을 바탕으로 한 기계 번역은 계속 허용되며, AI는 ‘menial(잡무)’에만 보조로 쓰되 사용 사실을 공개해야 합니다.

    Tech Insight — 진짜 핵심은 코드 품질이 아니라 ‘멘토링’입니다. PR 리뷰는 신규 기여자를 미래의 유지보수자로 키우는 과정인데, 그 피드백이 사람이 아니라 ‘기계에 흡수’된다면 저녁 시간을 쪼개 리뷰할 이유가 사라진다는 것이죠. 한쪽에서는 AI 업체들이 ‘곧 모든 코드를 AI가 짤 것’이라 말하는데, 정작 다수의 인기 오픈소스 프로젝트는 반대로 움직이고 있다는 역설이 눈길을 끕니다.


    관련 글

    출처

    1. I ported Kubernetes to the browser (ngrok.com)
    2. GeekNews — Kubernetes를 브라우저로 포팅했어요
    3. Atlassian’s DESIGN.md is here (atlassian.com)
    4. Godot will no longer accept AI-authored code (pcgamer.com)
    5. GeekNews — Godot, AI 작성 코드 기여를 더 이상 받지 않기로 함

    AI Biz Insider · Tech Digest · aibizinsider.com

  • 직원 8천명 자른 저커버그가…

    AI 에이전트 도입의 현실과 기업 ROI 격차를 상징하는 이미지
    TL;DR
    • 저커버그가 7월 2일 사내 회의에서 “AI 에이전트 개발이 기대만큼 빠르지 않았다”고 인정했다(로이터·테크크런치).
    • 메타는 올해 직원 약 8천 명(사무직 10%)을 감원, 7천 명을 AI 조직에 재배치하고 AI 인프라에 최대 1450억 달러를 투입한다.
    • 임원 79%가 ROI 부진·전략 부재로 고전 — 생성형 AI ROI 체감은 29%, AI 에이전트는 23%에 불과하다.
    • 그럼에도 기업 60%는 “AI 안 쓰는 직원 해고” 계획. 승부는 ‘감원 먼저’가 아니라 ‘업무 재설계 먼저’에서 갈린다.

    “사람을 AI로 대체하는 게 생각만큼 쉽지 않다.” 세계에서 AI에 가장 공격적으로 베팅해 온 경영자의 입에서 이 말이 나왔다면 이야기는 달라진다. 2026년 7월 2일, 마크 저커버그가 메타 사내 타운홀에서 던진 한마디는 ‘AI 도입=인력 감축’이라는 공식에 균열을 냈다.

    저커버그의 이례적 고백

    1450억 달러를 쓰고 나온 말

    로이터를 인용한 테크크런치 보도에 따르면, 저커버그는 사내 회의에서 AI 에이전트 개발 속도가 경영진이 기대했던 것처럼 “가속되지 않았다”고 말했다. 메타는 올해 직원 약 8천 명(전체 사무직의 약 10%)을 감원하고, 별도로 7천 명을 ‘Agent Transformation’을 포함한 AI 조직으로 재배치했다. 그러면서도 AI 인프라에는 올해에만 최대 1450억 달러를 쏟아붓는다.

    ‘깔끔하지 못한 감원’이라는 자평

    저커버그는 이번 감원이 “원래 그래야 했던 것만큼 깔끔하지 않았다(not as clean)”고 인정했다. 감원을 서두른 이유로는 “산업 변화에 빠르게 적응하지 못할까 봐”라는 최고위층의 불안을 들었다. 새 AI 중심 조직의 기대 효과는 “아직 실현되지 않았다”면서도, 향후 3~6개월 안에 투자 성과가 나타나기 시작할 것으로 본다고 덧붙였다.

    AI Biz Insider 분석 — 핵심은 ‘속도 압박’이 실제 성과보다 앞섰다는 점이다. “뒤처질까 봐” 감원을 서둘렀다는 저커버그의 설명은, 지금 많은 기업이 겪는 ‘FOMO(뒤처짐에 대한 공포) 기반 구조조정’의 전형이다. 세계 최대 규모의 AI 투자자조차 이 함정을 피하지 못했다.


    숫자로 드러난 ‘AI 도입의 배신’

    쓴 만큼 못 버는 기업들

    이 온도차는 메타만의 이야기가 아니다. AI 기업 라이터(WRITER)가 워크플레이스 인텔리전스와 함께 임원 1,200명을 포함한 2,400명을 조사한 ‘2026 기업 AI 도입’ 보고서를 보면, 임원의 97%가 “AI가 도움이 됐다”고 답했다. 그러나 생성형 AI에서 유의미한 ROI를 체감했다는 응답은 29%, AI 에이전트는 23%에 그쳤다. 절반에 가까운 48%는 자사 AI 도입이 “큰 실망이었다”고 털어놨다.

    감원은 늘고, 전략은 없다

    더 눈에 띄는 건 모순이다. 임원의 69%가 “AI 때문에 감원을 진행 중”이라고 답했지만, 39%는 “AI로 매출을 낼 공식 전략이 아예 없다”고 인정했다. 60%는 “AI를 쓰지 않거나 못 쓰는 직원을 해고하겠다”고 했으면서도, 75%는 자사 AI 전략이 “실질 지침이라기보다 보여주기에 가깝다”고 답했다. 감원 카드부터 꺼내지만 정작 로드맵은 비어 있다는 뜻이다.

    AI Biz Insider 분석 — ‘감원 먼저, 전략 나중’은 지속 가능하지 않다. 라이터 CEO의 말처럼 “감원은 AI 전략이 될 수 없다.” 조사에서 실제 성과를 낸 곳은 사람을 줄인 기업이 아니라, 사람과 에이전트의 협업 구조를 다시 설계한 기업이었다. 상위 사용자는 주당 약 9시간을 절약했는데, 이는 감원이 아니라 업무 재설계의 결과였다.


    그래서 우리 회사는 무엇을 해야 하나

    중소기업이 피해야 할 3가지 실수

    첫째, ‘감원 효과’부터 계산하지 말 것. 성과 데이터 없이 인력부터 줄이면 저커버그처럼 “깔끔하지 못한” 구조조정을 반복하게 된다. 둘째, ROI를 측정 가능한 업무 단위로 쪼갤 것. “AI 도입”이라는 구호가 아니라 “견적 작성 시간 40% 단축”, “1차 응대 자동화율 30%”처럼 숫자로 목표를 걸어야 한다. 셋째, 도구가 아니라 워크플로를 바꿀 것. 조사에서 성과를 낸 쪽은 단순 카피 도구가 아니라 부서 단위로 업무 흐름 자체를 재설계한 기업이었다.

    ‘3~6개월’이라는 골든타임

    저커버그조차 성과 시점을 3~6개월 뒤로 잡았다. 지금 필요한 건 대규모 베팅이 아니라, 한두 개 핵심 업무에서 측정 가능한 파일럿을 돌려 근거를 쌓는 일이다. 그 근거가 있어야 다음 투자도, 조직 개편도 ‘보여주기’를 넘어설 수 있다. AI 거품론이 커지는 지금이 오히려 냉정한 도입 설계의 적기다. 경쟁사가 감원과 과장 사이에서 흔들릴 때, 작은 파일럿으로 실질 ROI를 증명하는 회사가 다음 사이클의 승자가 된다.

    AI Biz Insider 분석 — 세계 최대 AI 투자자도 “아직”이라고 말하는 국면이다. 규모가 작을수록 유리한 점이 있다. 대기업보다 빠르게 파일럿을 돌리고, 안 되면 접고, 되는 것만 키우는 민첩함. 그 반복이 결국 감원보다 강한 경쟁력을 만든다.


    관련 글

    출처

    1. TechCrunch — Mark Zuckerberg tells staff that AI agents haven’t progressed as quickly as he’d hoped (2026.07.02)
    2. WRITER · Workplace Intelligence — AI Adoption in the Enterprise 2026

    AI Biz Insider · AI 비즈니스 · aibizinsider.com

  • 20만원 넣으면 40만원 된다고…

    2026 근로자 휴가지원사업 국내여행 40만원 포인트 안내
    핵심 정리
    • 15만 명 목표로 예산 소진 시까지 접수 — 여름 성수기 전에 서두르는 게 유리합니다.
    • 근로자 20만 원 + 기업 10만 원 + 정부 10만 원 = 총 40만 원 국내여행 포인트입니다.
    • 중소기업·소상공인·비영리단체·사회복지시설 재직 근로자(1년 이상, 연소득 5천만 원 이하)가 대상입니다.
    • 개인 단독 신청은 불가 — 회사가 먼저 신청해야 하며, 문의는 전담센터 1670-1330입니다.

    여름 휴가철, 여행 경비가 부담돼 계획을 접는 직장인이 많습니다. 그런데 내 돈 20만 원을 넣으면 회사와 정부가 20만 원을 얹어 40만 원짜리 여행 지갑을 만들어 주는 제도가 있습니다. 문화체육관광부와 한국관광공사가 운영하는 ‘근로자 휴가지원사업’입니다. 8년째 이어진 이 사업, 누가 어떻게 받는지 3분 만에 정리했습니다.

    근로자 휴가지원사업, 한마디로 무엇인가

    직장 내 자유로운 휴가문화를 만들고 국내여행을 활성화하기 위해, 근로자가 20만 원을 적립하면 소속 기업과 정부가 각각 10만 원씩 더해 총 40만 원을 국내여행 경비로 쓸 수 있게 지원하는 제도입니다. 적립된 포인트는 전용몰 ‘휴가샵’에서 숙박·교통·관광지 입장권·레저·여행 기획상품 등에 사용합니다.

    2018년부터 시행돼 7년간 중소기업 7만 곳, 근로자 67만 명 이상이 참여했습니다. 실태조사에 따르면 참여 근로자의 55.2%가 계획에 없던 국내여행을 다녀왔고, 정부지원금 10만 원 대비 약 8.9배의 여행 경비를 지출한 것으로 나타났습니다.

    정책 분석 — 핵심은 ‘내 돈을 두 배로 불려 쓴다’는 점입니다. 20만 원을 적립하면 40만 원이 되니 수익률로만 보면 100%입니다. 단, 현금이 아니라 국내여행 전용 포인트이므로 ‘여행 갈 계획이 있는 사람’에게 가장 유리합니다.


    누가 받나 — 대상과 자격요건

    참여할 수 있는 기업과 근로자 조건이 정해져 있습니다.

    참여 가능 기업

    • 중소기업(비법인은 임원까지 가능), 소상공인
    • 비영리민간단체, 사회복지법인·시설
    • 중견기업·대기업은 제외, 업종과 무관하게 전문직 종사자(의사·변호사·회계사 등)는 참여 불가

    근로자 요건

    참여 기업에 1년 이상 재직하고 연간 소득 5천만 원 이하인 근로자가 신청할 수 있습니다. 중요한 점은 개인이 혼자 신청할 수 없고, 반드시 소속 회사가 먼저 참여 신청을 완료해야 근로자가 분담금을 넣을 수 있다는 것입니다.

    정책 분석 — 이 사업의 병목은 ‘근로자’가 아니라 ‘회사’입니다. 대상이 되는데도 회사가 신청하지 않아 못 받는 경우가 흔합니다. 인사·총무 담당자에게 참여 신청을 먼저 제안하는 것이 실질적인 첫걸음입니다.


    얼마나, 어디에 쓰나

    근로자 20만 원, 기업 10만 원, 정부 10만 원이 모여 1인당 40만 원의 여행 포인트가 만들어집니다. 다만 누적 참여 5년 차 이상 중기업의 경우 기업 분담금이 10만 원에서 15만 원으로 올라가는 등 일부 조건 차이가 있습니다.

    포인트 사용처

    • 숙박(호텔·펜션·리조트), 교통(항공·기차·렌터카 등)
    • 국내여행 기획상품, 관광지 입장권, 체험·레저 상품

    사용은 전용몰 ‘휴가샵'(vacation.benepia.co.kr)과 전용 모바일 앱에서 이뤄집니다. 해외여행이나 현금 인출에는 쓸 수 없고 국내여행 관련 상품에만 사용됩니다.


    어떻게 신청하나 — 절차

    신청은 기업 단위로 이뤄지며, 흐름은 다음과 같습니다.

    • 기업 담당자가 근로자 휴가지원사업 누리집(vacation.visitkorea.or.kr)에서 참여 신청
    • 한국관광공사가 참여기업을 확정·안내
    • 기업이 참여 근로자 정보를 입력하고 근로자 분담금을 포함해 가상계좌로 일괄 입금
    • 정부지원금 1인당 10만 원이 추가 적립 → 근로자는 휴가샵 가입 후 40만 원 포인트로 국내여행 상품 구입

    신청은 15만 명을 목표로 지원금이 소진될 때까지 접수하므로, 예산이 일찍 마감될 수 있습니다. 여름 휴가 성수기를 노린다면 서두르는 것이 안전합니다.

    자주 묻는 질문(FAQ)

    Q1. 제가 직접 신청할 수 있나요?

    아닙니다. 개인 단독 신청은 불가능하며, 소속 회사가 먼저 기업 단위로 참여 신청을 해야 근로자가 분담금을 넣고 포인트를 받을 수 있습니다.

    Q2. 40만 원을 해외여행에 써도 되나요?

    안 됩니다. 이 포인트는 국내여행 활성화가 목적이라 숙박·교통·관광지 입장권 등 국내여행 관련 상품에만 사용할 수 있습니다.

    Q3. 언제까지 신청하나요?

    별도 마감일보다 예산 소진 여부가 관건입니다. 15만 명 목표 소진 시까지 접수하므로, 참여를 원한다면 가능한 한 빨리 회사를 통해 신청하는 것이 좋습니다.


    관련 글

    출처

    1. 한국관광공사 근로자 휴가지원사업 — 참여대상·신청절차
    2. 대한민국 정책브리핑 — 근로자 휴가지원사업 개요(문화체육관광부)

    AI Biz Insider · 내 삶에 닿는 정책 · aibizinsider.com

  • Anthropic Just Made Its Flagship AI Harder to Recommend

    Claude Sonnet 5 agentic AI model concept with cyan-teal neural network and terminal interface
    KEY POINTS
    • Anthropic launched Claude Sonnet 5 on June 30, 2026, calling it its most agentic Sonnet model to date.
    • Sonnet 5 performs close to the flagship Opus 4.8 while costing far less to run.
    • Introductory pricing is $2 per million input tokens and $10 per million output tokens through August 31, 2026.
    • It ships with real-time cyber safeguards on by default and could not build a working Firefox exploit in testing.

    Anthropic just priced its cheaper model at $2 per million input tokens and $10 per million output tokens, and claimed it lands close to the performance of Opus 4.8, a model that costs $5 and $25 for the same volumes. On June 30, 2026, the company released Claude Sonnet 5 and described it as the most agentic Sonnet it has ever built. For a lot of teams, the interesting question is no longer whether Sonnet is good enough, but whether the premium flagship still earns its price.

    A Sonnet That Closes the Gap on Opus

    Anthropic frames the release around a shift in where agentic gains have been coming from. In its telling, the agentic AI era began with Sonnet-class models, Claude Sonnet 3.5, 3.6, and 3.7 were the first to show strong coding and tool use, but the clearest recent gains had moved to the more expensive Opus tier. Sonnet 5 is positioned to narrow that gap: the company says its performance is close to that of Opus 4.8 but at lower prices, and calls it a substantial improvement over its predecessor, Sonnet 4.6, on reasoning, tool use, coding, and knowledge work.

    Built to run on its own

    The headline capability is autonomy. Anthropic says Sonnet 5 can make plans, use tools like browsers and terminals, and run autonomously at a level that just a few months ago required larger and more expensive models. Early access partners echoed the theme. One tester, Neel Chotai, said he asked Sonnet 5 to investigate a bug, and unprompted it wrote a reproducing test, implemented the fix, then stashed it to confirm the bug came back without the change, all in a single pass. Another, Daniel Shepard, described handing it a two-part job, updating Salesforce account tiers and sending a launch announcement to enterprise contacts, that it finished end to end where previous models used to stall halfway.

    Trend Insight — The competitive story of 2026 is no longer top-line benchmark scores, it is cost-per-completed-task. By pushing near-flagship autonomy into a mid-tier price band, Anthropic is targeting the operational math that decides which model teams actually deploy at scale.


    The Pricing Is the Real Announcement

    Claude Sonnet 5 is available everywhere from launch day. It is the default model for Free and Pro plans and is available to Max, Team, and Enterprise users, as well as in Claude Code and on the Claude Platform, where developers call it with the identifier claude-sonnet-5. On the API it launched with introductory pricing of $2 per million input tokens and $10 per million output tokens through August 31, 2026, after which it moves to $3 per million input and $15 per million output. For reference, Opus 4.8 is priced at $5 per million input and $25 per million output, roughly double.

    The tokenizer caveat worth knowing

    There is a detail buried in the footnotes that developers should not miss. Sonnet 5 uses an updated tokenizer that changes how the model processes text, which improves performance but can map the same input to more tokens, roughly 1.0 to 1.35 times depending on content type. Anthropic says it set the introductory pricing so the transition from Sonnet 4.6 is roughly cost-neutral. In practice that means the sticker price and your actual bill can diverge, so teams migrating should measure real token consumption rather than assume a flat discount.

    Trend Insight — Introductory pricing plus a tokenizer change is a classic adoption lever, it lowers the visible barrier to switching while the vendor learns real usage patterns. Watch September 1, when standard pricing kicks in, for the true cost signal.


    Safety Shipped On by Default

    Anthropic’s pre-deployment evaluations found Sonnet 5 to be safer overall than Sonnet 4.6. The company reports it is better at refusing malicious requests and resisting hijack attempts in prompt-injection attacks, and shows lower rates of hallucination and sycophancy. On an automated behavioral audit testing a wide range of misaligned behaviors, Sonnet 5 scored lower, meaning safer, than 4.6, though still higher than the more capable Opus 4.8 and Claude Mythos Preview.

    On cybersecurity, Anthropic says it did not deliberately train Sonnet 5 on cyber tasks. In an evaluation developed with Mozilla that tested whether models could build exploits for vulnerabilities in Firefox 147, neither Sonnet 5 nor Sonnet 4.6 could develop a working exploit, both scored 0.0 percent, though Sonnet 5 showed a slightly higher partial-success rate. Because the model is somewhat stronger than its predecessor, Anthropic launched it with real-time cyber safeguards enabled by default, the same set used in Claude Opus 4.7 and 4.8. All the tested Firefox vulnerabilities have since been patched in Firefox 148.

    Trend Insight — Shipping safeguards on by default, rather than behind an opt-in, signals how much of the frontier debate has moved from capability to controllability. As mid-tier models get more agentic, default guardrails become a product requirement, not a compliance afterthought.


    Related

    Sources

    1. Anthropic — Introducing Claude Sonnet 5 (Jun 30, 2026)
    2. Anthropic Newsroom
    3. TechCrunch — Artificial Intelligence

    AI Biz Insider · AI Trends EN · aibizinsider.com

  • 제일 센 AI만 골라서 막혔다…

    규제 장벽 앞에서 멈춘 AI 모델과 그 사이를 통과하는 AI 모델을 표현한 일러스트
    TL;DR
    • 미국 정부가 사이버보안 벤치마크 점수를 기준으로 ‘가장 강한’ 프론티어 AI만 골라 규제 중 — 앤트로픽 Fable 5는 강제 오프라인, 오픈AI GPT-5.6은 정부 승인 20여 곳으로 제한.
    • 반면 구글 제미나이 3.5 프로는 같은 벤치마크에서 점수가 낮아(제미나이 3.1 프로 터미널벤치 70.7% vs GPT-5.6 Sol 88.8%) 아무 규제 없이 7월 출시가 유력하다.
    • 핵심 스펙은 200만 토큰 문맥(현존 최대)과 딥싱크(Deep Think) 추론 모드. 다만 6월에서 7월로 밀린 출시와 연구자 4명 이탈이 그림자다.
    • ‘1등이라서’가 아니라 ‘1등이 아니라서’ 시장을 먹는 역설 — 규제가 엔지니어링보다 경쟁 구도를 더 크게 흔들고 있다.

    프론티어 AI 경쟁에서 가장 앞선 모델이 오히려 시장에서 사라지고 있다. 앤트로픽의 Fable 5는 미국 정부 명령으로 17일째 오프라인이고, 오픈AI의 최신 GPT-5.6은 정부가 지정한 20여 개 기관만 쓸 수 있다. 그런데 이 빈자리를 노리는 건 ‘제일 센 모델’이 아니라, 그 기준을 살짝 밑도는 구글 제미나이 3.5 프로다. 성능이 조금 부족한 것이 오히려 출시 티켓이 되는, 낯선 시대가 열렸다.

    정부가 ‘가장 센 AI’부터 껐다

    시작은 6월 2일 행정명령이다. 겉으로는 출시 30일 전까지 모델을 자율 제출해 검토받는 틀이지만, 실제로는 성능이 일정 선을 넘은 모델만 골라 막는 ‘사실상의 역량 게이팅’으로 작동하고 있다. 문제는 그 선 — 사이버보안 벤치마크 임계값 — 이 한 번도 공개된 적이 없다는 점이다. 어떤 지표에서 몇 점을 넘으면 규제 대상인지, 어느 부처가 결정하는지, 심사가 얼마나 걸리는지 모두 미공개다.

    앤트로픽 Fable 5 — 상용 프론티어 모델 첫 강제 셧다운

    6월 12일 오후, 상무부는 수출통제 지시로 외국인의 Fable 5 접근을 차단하라고 명령했다. 사실상 전면 중단이다. 발단은 아마존 연구진이 미 당국에 시연한 우회 기법이었고(앤트로픽은 이를 ‘보편적이지 않은 좁은 사례’라 반박), 이후 보도는 더 무거웠다. NSA 국장은 상원 정보위 브리핑에서, Fable 5가 가중치를 공유하는 기반 모델 Mythos가 레드팀 훈련에서 NSA 기밀 시스템 대부분을 자율 침투했다고 증언했다. 6월 27일 기준 규제 해제는 임박했지만, 펜타곤·NSA 최종 승인은 아직 대기 중이다.

    GPT-5.6 삼형제(Sol·Terra·Luna) — 정부 승인 20여 곳만

    오픈AI의 새 모델 패밀리 GPT-5.6은 6월 25일 출시됐지만, 정부와 공유된 파트너 약 20곳으로 접근이 묶였다. 이유는 역시 사이버 역량이다. 플래그십 Sol은 오픈AI 내부 CTF(Capture the Flag) 평가에서 96.7%, 외부 지표인 터미널벤치 2.1에서 88.8%를 기록하며 자체 ‘준비 프레임워크’의 ‘높음(High)’ 위험 등급을 넘었다. 오픈AI조차 “이 방식이 장기 표준이 되어선 안 된다”고 공개 반발했지만, 앤트로픽과 달리 사전에 조건을 수용해 통제된 롤아웃을 택했다.

    Trend Insight — 핵심은 ‘기준이 공개되지 않았다’는 사실이다. 전 백악관 AI 참모 딘 볼은 이를 두고 “의회를 거치지 않은 사실상의 강제 라이선스 체제”라고 규정했다. 개발자는 어떤 성능이 ‘너무 센’ 것인지 사전에 알 수 없고, 이의 제기 절차도 없다. 모델 접근성이 엔지니어링이 아니라 정책 변수로 바뀌었다는 뜻이다.


    구글이 어부지리로 웃는 이유

    그 결과 지금 프론티어 신모델을 규제 없이 내놓을 수 있는 유일한 대형 랩은 구글이다. 제미나이 3.5 프로는 애초에 한 번도 제한 대상에 오른 적이 없다. 규제로 비워진 자리를, 규제를 피한 모델이 채우는 그림이 만들어졌다.

    200만 토큰 문맥 + 딥싱크(Deep Think)

    제미나이 3.5 프로의 무기는 두 가지다. 첫째, 200만 토큰 문맥 창 — 현존 상용 모델 중 최대이며 경쟁작 대다수의 두 배 수준이다. 둘째, 가장 어려운 과학·수학·코딩 문제를 겨냥한 ‘딥싱크’ 추론 모드다. 딥싱크는 월 250달러 Ultra 요금제 전용으로 열린다. 가격은 이전 세대와 비슷한 수준(입력 100만 토큰당 약 15달러, 출력 약 60달러)이 예상되고, 딥싱크 모드에는 약 10배 프리미엄이 붙는 구조로 알려졌다.

    낮은 사이버 점수가 오히려 ‘통과 티켓’

    규제를 피한 진짜 이유는 성능 격차다. 구글의 직전 상용 모델 제미나이 3.1 프로는 터미널벤치 2.1에서 70.7%로, GPT-5.6 Sol(88.8%)보다 18%p 넘게 낮다. 정부가 주시하는 지표에서 ‘아직 그 선을 넘지 않았다’는 것이다. 역설적으로, 최고가 아니라는 사실 자체가 무규제 출시의 근거가 됐다. 다만 이는 어디까지나 이전 세대 점수 기준이며, 프로 등급의 실제 성능은 출시 후 평가받게 된다.

    Trend Insight — Fable 5가 빠지며 생긴 ‘초장문 문맥’ 공백을 제미나이 3.5 프로의 200만 토큰이 정확히 겨냥한다. 6월 12일 이전 Fable 5의 긴 문맥에 워크플로를 맞춰 둔 개발자라면, 지금 가장 현실적인 대안이 바로 이 모델이라는 계산이 선다.


    지연과 인재 유출, 7월이 진짜 시험대

    기회가 열렸다고 해서 구글의 상황이 마냥 편한 것은 아니다. 정작 주인공인 제미나이 3.5 프로부터 일정이 밀렸고, 조직에서는 경고음이 울렸다.

    6월에서 7월로 밀린 속사정

    제미나이 3.5 프로는 원래 6월 출시가 목표였지만 7월로 연기됐다. 구글은 초기 테스터가 지적한 토큰 효율 문제와, 앞서 5월 19일 I/O에서 공개한 3.5 플래시의 롤아웃에서 얻은 교훈을 반영하기 위해서라고 설명한다. 플래시는 이미 제미나이 3.1 프로를 대부분의 코딩·에이전트 벤치마크에서 앞섰고(터미널벤치 2.1 76.2%), 프로는 더 어려운 추론과 초장문 검색에서 남은 격차를 메우는 역할을 맡는다.

    제미나이 연구자 4명, 앤트로픽으로

    6월 21~27일 주간, 시니어 제미나이 연구자 4명이 앤트로픽으로 이직을 알렸다. 규제와는 무관한 조직·제품 차원의 이슈지만, 7월 출시의 무게가 부쩍 커진 시점에 나온 신호라 뼈아프다. 최고의 모델을 무규제로 낼 수 있는 흔치 않은 기회를, 정작 흔들리는 조직으로 잡아야 하는 상황인 셈이다.

    Trend Insight — 진짜 관전 포인트는 ‘출시 이후’다. 정부 평가자가 프로 등급의 사이버 성능을 직접 측정한 뒤에도 제미나이 3.5 프로가 계속 무규제로 남을지는 구글조차 답하지 못한 상태다. 오늘의 어부지리가 다음 달의 규제 대상이 될 수도 있다.


    한국 기업·개발자가 챙길 3가지

    이번 사건은 먼 나라 규제 이야기가 아니다. 프론티어 모델을 실무에 얹는 국내 팀이라면 세 가지를 다시 점검할 때다.

    접근성 리스크가 새 변수다

    특정 모델이 하루아침에 전 세계에서 끊길 수 있다는 것이 Fable 5로 증명됐다. 사전 통보도, 이의 절차도 없었다. 핵심 워크플로를 단일 프론티어 모델에 100% 종속시키지 말고, 대체 모델로 갈아탈 수 있는 추상화 계층을 미리 설계해 두는 편이 안전하다.

    초장문 문맥이 기본값이 되는 흐름

    200만 토큰 시대가 열리면 ‘문서를 잘게 쪼개 검색(RAG)하던’ 설계 전제가 흔들린다. 문맥에 통째로 넣을지, 여전히 RAG로 비용을 아낄지 — 정확도와 토큰 비용을 함께 저울질하는 재설계가 필요하다.

    ‘가장 센 모델’이 늘 최선은 아니다

    규제·가격·지연을 모두 감안하면, 지금 안정적으로 쓸 수 있는 모델이 실무에서는 더 강하다. 벤치마크 1등을 줇기보다, 접근성이 보장되고 비용이 예측 가능한 모델을 기본값으로 두는 전략이 오히려 리스크를 줄인다.

    Trend Insight — 규제가 기술만큼 중요한 변수가 된 시대다. 모델 선택은 이제 성능표만이 아니라 ‘지속 가능한 접근성’까지 함께 보는 의사결정으로 바뀌었다. 가장 똑똑한 모델보다, 내일도 확실히 켜져 있을 모델이 이긴다.


    관련 글

    출처

    1. Google — Gemini 3.5: frontier intelligence with action (2026-05-19)
    2. Tech Times — Gemini 3.5 Pro Cleared for July Launch as Fable 5 Nears Return, GPT-5.6 Stays Locked (2026-06-29)
    3. TechCrunch — OpenAI limits GPT-5.6 rollout after government request (2026-06-26)

    AI Biz Insider · AI 트렌드 · aibizinsider.com

  • 월세 480만원 나라가 낸다고…

    2026 청년월세 지원 최대 480만원 안내 이미지
    핵심 정리
    • 2026년 1차 신규접수는 5월 29일로 마감 — 그러나 올해부터 ‘계속사업’으로 전환돼 매년 다시 모집한다
    • 지원금은 월 최대 20만원씩 최장 24개월, 생애 딱 한 번 최대 480만원(실제 내는 월세 범위 안에서 지급)
    • 대상은 만 19~34세 무주택 청년 — 청년가구 기준 중위소득 60% 이하·총재산 1억 2,200만원 이하
    • 2026년부터 청약통장 가입 요건이 사라져 문턱이 낮아졌고, 자격 자가진단은 지금도 복지로·마이홈에서 가능하다

    2022년 처음 생긴 청년월세 지원사업으로 지금까지 전국 22만 2,000명의 청년이 월세를 돌려받았다. 그리고 2026년, 이 제도는 ‘한시사업’이라는 꼬리표를 떼고 매년 계속되는 ‘계속사업’으로 바뀌었다. 월 20만원씩 최장 2년, 생애 한 번 최대 480만원. 전세가 아닌 월세방에 사는 청년이라면 반드시 알아둬야 할 돈이다. 다만 올해 첫 접수는 이미 끝났고, 제도는 계속되니 지금은 ‘자격 확인’과 ‘다음 접수 준비’가 핵심이다.

    얼마를, 몇 달이나 받나

    지원금은 월 최대 20만원이다. 이걸 최장 24개월(2년) 동안, 생애 딱 한 번 받을 수 있다. 단순 계산하면 20만원 곱하기 24개월, 최대 480만원이다. 다만 무조건 20만원이 나오는 것은 아니고, 실제로 내는 월세 범위 안에서만 지급된다. 예를 들어 월세가 18만원이면 18만원까지만 지원된다.

    주거급여를 이미 받고 있는 청년이라면, 월세 지원액에서 ‘청년 주거급여 분리지급액’에 해당하는 월차임분을 뺀 나머지 금액만 받는다. 즉 같은 월세를 두 번 지원받는 구조는 아니라는 뜻이다.

    정책 분석 — 월 20만원이 작아 보여도 2년이면 480만원이다. 청년 1인 가구의 월 생활비에서 월세가 차지하는 비중을 생각하면, 보증금 대출 이자와 관리비까지 얹혀 있는 상황에서 결코 작지 않은 액수다. 특히 ‘생애 1회’이므로, 월세가 가장 부담스러운 시기에 맞춰 신청 타이밍을 잡는 전략이 중요하다.


    누가 받을 수 있나 — 자격 요건

    나이·주거 요건

    나이는 만 19세부터 34세까지다. 부모와 별도로 거주하는 무주택 청년이어야 한다. 주택 기준은 기본적으로 보증금 5,000만원 이하, 월세 60만원 이하다. 월세가 60만원을 넘더라도 보증금을 월세로 환산한 금액과 합산해 일정 기준 이하이면 지원되는 경우가 있으니, 애매하면 복지로 자가진단으로 확인하는 것이 정확하다. 반전세(보증부월세), 하숙집, 대학·회사 기숙사, 연세·사글세 계약도 대상에 포함되며, 전세만 제외된다.

    소득·재산 요건

    청년가구는 기준 중위소득 60% 이하이면서 총재산 1억 2,200만원 이하여야 한다. 여기에 부모까지 포함한 원가구는 기준 중위소득 100% 이하, 총재산 4억 7,000만원 이하여야 한다. 청년가구는 청년 본인과 배우자·자녀 등을 말하고, 원가구는 여기에 부모를 더한 개념이다.

    정책 분석 — 핵심 함정은 ‘원가구’ 소득이다. 청년 본인 소득이 아무리 낮아도 부모 소득이 중위 100%를 넘으면 탈락할 수 있다. 반대로 독립한 지 오래됐거나 부모 소득이 낮은 저소득 청년에게는 상대적으로 문이 넓다. 부모가 이혼·별거한 경우에도 가족관계증명서상 부모 소득을 확인한다는 점을 미리 알아두자.


    2026년, 무엇이 달라졌나

    가장 큰 변화는 한시사업에서 계속사업으로의 전환이다. 2022년 시작할 때는 정해진 기간에만 모집하는 한시 지원이었지만, 지난해 국정과제로 선정되면서 이제는 매년 신규 수혜자를 모집하는 계속사업이 됐다. 예산이 소진되면 끝나던 구조에서, 매년 다시 기회가 열리는 구조로 바뀐 것이다.

    두 번째 변화는 청약통장 가입 요건 폐지다. 2차 사업 때 신설됐던 청약통장 가입 요건이 2026년 신규 모집부터 삭제됐다. 통장이 없어 신청을 망설였던 청년도 이제 대상이 될 수 있다. 지원 기간은 최장 24개월(생애 1회)로 유지된다.

    정책 분석 — ‘계속사업’ 전환이 이 정책의 성격을 완전히 바꿨다. 올해 접수를 놓쳤어도 내년, 그 다음 해를 노릴 수 있다는 뜻이다. 여기에 청약통장 요건까지 사라져 대상 폭이 넓어졌다. 지금 자격이 안 되더라도, 소득·재산 상황이 바뀌면 다음 접수 때 다시 도전할 가치가 충분하다.


    언제, 어떻게 신청하나

    신청 일정

    2026년 1차 신규접수는 3월 30일부터 5월 29일까지로 이미 종료됐다. 올해는 전국에서 6만 명의 신규 수혜자를 선정하며, 선정자는 9월에 공지되고 5월분부터 소급해 지급된다. 계속사업으로 전환된 만큼 이후에도 국토교통부 예산과 지침에 따라 정기 접수 기간이 운영될 예정이다. 다음 접수가 언제 열리는지는 복지로와 국토교통부 공고를 통해 반드시 확인해야 한다.

    신청 채널

    신청은 복지로(bokjiro.go.kr) 온라인 또는 거주지 행정복지센터 방문으로 한다. 접수가 열리기 전이라도 마이홈포털(myhome.go.kr)과 복지로의 자가진단(모의계산) 메뉴에서 내가 대상이 되는지 미리 확인할 수 있다. 궁금한 점은 청년월세 콜센터 1600-0777, 또는 국토교통부 청년주거정책과(044-201-3640)로 문의하면 된다.


    자주 묻는 질문

    Q1. 전세로 살아도 받을 수 있나요?

    전세는 지원 대상이 아닙니다. 다만 보증금과 월세를 함께 내는 반전세(보증부월세)는 인정되고, 하숙집·대학 및 회사 기숙사·연세·사글세 형태의 임대차 계약도 지원 대상에 포함됩니다. 월세 형태로 돈을 내고 있다면 계약 형식이 조금 달라도 우선 자가진단으로 확인해 보는 것이 좋습니다.

    Q2. 부모님과 따로 사는데 부모 소득도 보나요?

    네. 청년 본인(청년가구) 소득뿐 아니라 부모를 포함한 원가구 소득까지 함께 봅니다. 부모님이 이혼했거나 별개의 가구에 속해 있어도, 청년을 중심으로 가족관계증명서에 표시되는 부모를 모두 포함해 원가구 소득을 확인합니다. 이 때문에 본인 소득만 낮다고 무조건 대상이 되는 것은 아닙니다.

    Q3. 지금(7월)도 신청할 수 있나요?

    2026년 1차 접수는 5월 29일에 마감됐습니다. 다만 계속사업으로 바뀌어 다음 정기 접수가 예정돼 있으니, 지금은 복지로·마이홈 자가진단으로 자격을 확인하고 소득·재산 서류를 미리 준비해 두는 것이 유리합니다. 다음 접수 공고가 뜨면 곧바로 신청할 수 있도록 알림을 설정해 두는 것을 추천합니다.


    관련 글

    출처

    1. 정책브리핑·국토교통부, ‘청년들에 2년간 월세 최대 20만 원 지원…30일부터 접수’ (2026.3.18)
    2. 정책브리핑 정책오디오, ‘청년월세 특별지원을 아시나요?’ (국토교통부 주거복지지원과)
    3. 복지로, 청년월세 한시(특별) 지원 서비스 안내

    AI Biz Insider · 내 삶에 닿는 정책 · aibizinsider.com

  • Saudi Aramco Just Bet $800M Against Closed AI

    Open-source AI cloud infrastructure and GPU data center compute
    KEY TAKEAWAYS
    • Together AI raised an $800 million Series C at an $8.3 billion post-money valuation, led by Saudi Aramco’s venture arm, with NVIDIA, Vista Equity Partners, and General Catalyst joining.
    • The pitch: run open models like DeepSeek and Kimi at 6x to 60x lower cost than closed frontier APIs, protecting the margins that OpenAI-style pricing quietly erodes.
    • Annual bookings crossed $1.15 billion last quarter, and the company plans to scale its compute footprint roughly 50-fold over the next five years.
    • Aramco and Schneider Electric backing the round is a signal that energy giants now see AI infrastructure, not models, as the defining capital project of the decade.

    On July 1, 2026, the venture arm of the world’s largest oil company led an $800 million bet not on a flashy chatbot, but on making artificial intelligence cheap. Together AI, a San Francisco startup that runs open-source models for enterprises, closed a Series C at an $8.3 billion valuation. The lead investor was Aramco Ventures. The subtext was unmistakable: the smart money has stopped chasing the next frontier model and started buying the infrastructure that makes every other model affordable.

    The $800 Million Bet Against Closed AI

    Who actually wrote the checks

    Aramco Ventures led the round, but the cap table reads like a cross-section of who controls the AI economy. NVIDIA, Vista Equity Partners, General Catalyst, Emergence Capital, March Capital, Pegatron, and SentinelOne’s S Ventures all participated, alongside Schneider Electric’s venture fund. The valuation jump is steep: Together AI raised a $305 million Series B in February 2025 at roughly $3 billion, meaning its price tag has nearly tripled in under 18 months. For a company founded in 2022, that is a vertical climb.

    What makes the round unusual is not the size but the identity of the lead. When an oil major’s investment arm writes the biggest check in an AI infrastructure deal, it is placing a long-duration bet that compute, not crude, is the resource worth cornering next.

    Business Insight — Strategic investors rarely lead purely for financial return. Aramco taking the lead position signals that sovereign and energy capital view AI infrastructure as the next pipeline to own, and they would rather fund the demand for power than merely sell it.


    Why Open Source Became a Margin Story

    Frontier pricing eats the P&L

    Together AI’s growth rests on an uncomfortable truth for any business built on closed-model APIs: frontier pricing can consume an entire product margin. The company positions itself as the infrastructure layer for the alternative, helping enterprises train and run open models such as DeepSeek, Nemotron, MiniMax, and Kimi at a fraction of the cost of closed systems, with comparable or better performance. Customers report savings of 6x to 60x versus closed-model pricing. AI customer-support startup Decagon, for example, cut its inference costs sixfold after moving to Together.

    The demand data backs the thesis. Open-source model usage across the industry tripled over the past twelve months, and McKinsey found that nearly three-quarters of organizations expect to increase their use of open-source AI. Together AI’s own annual bookings crossed $1.15 billion last quarter, with paying customers that include Cursor, Cognition, and Decagon.

    Business Insight — For most companies, the AI decision has quietly shifted from capability to unit economics. Once open models reach parity, the buying question becomes cost per token at scale, and that is where a 6x to 60x gap turns into a durable competitive moat.


    Energy Money Meets Compute

    Intelligence as cheap as electricity

    Co-founder and CEO Vipul Ved Prakash framed the mission in terms an oil investor understands: “Intelligence is becoming a foundational resource for the modern economy, every bit as essential as electricity, bandwidth or capital. Our mission is to ensure that intelligence is abundant, not expensive.” Abhishek Shukla of Aramco’s Prosperity7 Ventures went further, calling AI infrastructure over the next decade “the biggest infrastructure project in human history.”

    Schneider Electric’s participation makes the convergence literal. Its CEO noted that AI and energy infrastructure are merging, with efficiency as the link between them, because more efficient AI means less energy consumed per workload. Together AI says it will use the capital to scale its capacity and infrastructure footprint roughly 50-fold over the next five years, backed by the kind of long-term power and capital commitments only strategic investors can supply.

    Business Insight — The AI buildout is increasingly an energy story wearing a software label. Whoever controls efficient compute controls the cost of intelligence, and energy incumbents have both the capital and the electrons to make that bet at a scale venture funds cannot match.


    The Neocloud Race and Its Risk

    Can a startup out-scale the hyperscalers?

    Together AI is not alone in the so-called neocloud wave. Rivals like Groq and RunPod rent out raw GPU capacity, while TensorWave recently raised $350 million building on AMD chips and Upscale AI extended its round to a $2 billion valuation. What sets Together apart is that it bundles compute with its own inference-optimization software, which it says can cut the cost of running popular models by up to 80 percent. That software layer is the moat around what would otherwise be a commodity hardware business.

    The risk is equally clear. The hyperscalers, flush with hundreds of billions in capital spending, are building their own inference capabilities at a scale no startup can match. Together AI’s wager is that open-source flexibility plus a software edge can defend its position before the giants catch up. The $800 million, and the identity of the backers, buys it time to find out.

    Business Insight — In infrastructure markets, distribution and capital usually beat cleverness over the long run. Together’s survival depends on locking in enterprise switching costs through software and savings before hyperscalers commoditize the layer beneath it.


    Related

    Sources

    1. Together AI Raises $800 Million at $8.3 Billion Valuation to Make Frontier AI Accessible to All (Business Wire, July 1, 2026)
    2. Together AI raises $800 million in Series C led by Aramco Ventures (The Next Web, July 1, 2026)
    3. Neocloud Together AI raises $800M, leaps to $8.3B valuation (TechCrunch, July 1, 2026)
    4. Together AI raises $800 million Series C at $8.3 billion valuation (Quartz, July 1, 2026)

    AI Biz Insider · AI Business EN · aibizinsider.com

  • 엔비디아 다음 주인공은…

    AI 데이터센터 서버 보드 위에서 빛나는 HBM 메모리와 DRAM 모듈
    TL;DR
    • 미국 메모리 기업 마이크론 주가가 한 달 새 236% 폭등, 지난주 목요일 한때 메타·테슬라 시가총액을 제치고 약 1조 2,700억 달러를 찍었다.
    • AI 서버가 삼켜버린 HBM·D램 품귀(‘RAMageddon’) 덕에 마이크론 3분기 매출은 4배(414.5억 달러), 순이익은 15배(282억 달러)로 뛰었다.
    • 진짜 중심은 한국이다. SK하이닉스 HBM 점유율은 업계 추정 약 60%, 삼성과 함께 첨단 생산능력을 HBM으로 대이동 중이다.
    • 사장님 체크포인트: D램 가격이 3분기 40~50% 추가 상승 전망. 서버·PC 조달비와 클라우드 단가 인상에 지금 대비해야 한다.

    한동안 ‘싸구려 부품’ 취급을 받던 메모리 반도체가 갑자기 AI 시대의 가장 뜨거운 자산이 됐다. 지난주 미국 아이다호의 메모리 기업 마이크론(Micron)은 하루지만 메타와 테슬라의 시가총액을 뛰어넘었다. 그리고 이 판의 진짜 중심에는 SK하이닉스와 삼성전자, 한국이 서 있다. 이건 단순한 주식 이야기가 아니다. 우리 회사가 내년에 서버 한 대, 노트북 한 대를 살 때 지불할 금액이 지금 결정되고 있다는 신호다.

    메타·테슬라를 하루 제친 ‘메모리 회사’

    마이크론 주가는 최근 한 달 동안에만 236% 폭등해 지난 금요일 주당 1,132달러에 마감했다. 2025년 중반까지만 해도 100달러를 밑돌던 주식이다. 시가총액은 약 1조 2,700억 달러로, 같은 날 메타(1조 3,900억 달러)와 테슬라(1조 4,200억 달러)에 바짝 붙었다. 목요일에는 두 회사를 잠깐이나마 앞질렀다. 실적도 폭발했다. 3분기 매출은 전년 대비 4배 늘어 414.5억 달러, 순이익은 18.8억 달러에서 282억 달러로 뛰었고, 4분기 가이던스로 490억~510억 달러를 제시했다.

    월가는 오래전부터 ‘제2의 엔비디아’가 될 상장사를 찾고 있었고, 이번엔 메모리에서 답을 찾았다는 분위기다. 윌리엄 블레어의 세바스티앙 나지 애널리스트는 “수요 증가 속도가 신규 클린룸 증설 속도를 계속 앞지른다”며 판매단가 상승과 실적 가시성을 근거로 ‘아웃퍼폼’ 의견을 유지했다.

    왜 하필 지금, 메모리인가

    AI 서버 한 대는 노트북과는 비교가 안 될 만큼 많은 메모리를 요구한다. 특히 GPU에 붙어 데이터를 초고속으로 실어 나르는 HBM(고대역폭메모리)이 핵심이다. 엔비디아는 물론 마이크로소프트, 아마존 AWS, 구글, 메타, 오라클 같은 하이퍼스케일러가 자체 시스템을 만들며 메모리를 싹쓸이하자, 델·HP 같은 PC 제조사까지 물량 확보에 뛰어들며 사재기가 사재기를 부르는 국면이 됐다. 시장에서 ‘RAMageddon(램+아마겟돈)’이라 부르는 이 품귀는 2027년까지 이어질 것으로 전망된다.

    AI Biz Insider 분석 — AI 투자의 무게중심이 ‘GPU 연산’에서 ‘GPU를 먹여 살리는 메모리’로 옮겨가고 있다. 연산 칩만 봐서는 공급망의 절반만 본 것이다. 앞으로 AI 인프라 기사를 읽을 때는 GPU 옆에 붙는 HBM 물량과 가격을 함께 봐야 전체 그림이 잡힌다.


    진짜 승부처는 한국이다

    마이크론이 화제의 주인공이지만, HBM 시장의 실질적 주도권은 한국에 있다. 업계 추정으로 SK하이닉스는 HBM 시장의 약 60%를 쥐고 있고, 엔비디아와의 긴밀한 협력과 선제 투자를 앞세워 2025년 초에는 약 40년간 이어진 삼성전자의 메모리 매출 1위 자리에 도전장을 내밀기도 했다. 두 회사 모두 첨단 생산능력의 상당 부분을 고수익 HBM으로 돌리고 있으며, 차세대 HBM4는 엔비디아 ‘루빈(Rubin)’ 아키텍처에 맞춰 양산 시점을 2026년 2월로 앞당긴 것으로 알려졌다.

    문제는 공급을 쉽게 늘릴 수 없다는 점이다. HBM4는 D램을 12단, 16단으로 정밀하게 쌓아 올려야 해 ‘수율의 벽’에 부딪힌다. 삼성 메모리 부문 수장은 주요 메모리 제품의 ‘심각한 공급 부족’이 최소 2027년까지 이어질 것이라 경고했고, 삼성 P4L, SK하이닉스 M15X 같은 신규 팹이 본격 가동돼야 숨통이 트일 전망이다.

    AI Biz Insider 분석 — 한국 기업 입장에서 이건 ‘남의 나라 호황’이 아니라 우리가 서 있는 공급망의 심장이다. 다만 마이크론이 엔비디아·앤트로픽과 장기 공급계약(SCA)을 잇달아 맺으며 추격하는 만큼, HBM 주도권은 지켜야 하는 자리이지 보장된 자리가 아니다.


    사장님이 체감할 변화: IT 비용과 조달

    이 뉴스가 CEO에게 중요한 이유는 단 하나, ‘비용’이다. 투자은행 제퍼리스는 D램 가격이 3분기 40~50%, 4분기 30~40% 추가 상승하고 2028년 전까지는 뚜렷한 하락이 없을 것으로 봤다. 여파는 이미 소비자 시장에 나타났다. 애플은 맥북·아이패드 가격을 올렸고, 마이크로소프트는 엑스박스 가격을 인상했으며, 밸브는 1,000달러 미만을 목표로 했던 스팀 머신을 결국 1,049달러에 내놓았다.

    기업 IT 예산에는 서버, PC, 노트북 구매비는 물론 클라우드 사용료까지 연쇄적으로 반영된다. 메모리 원가가 오르면 클라우드 사업자도 결국 단가로 전가하기 때문이다. ‘내년에 사면 되지’가 가장 위험한 전략이 되는 국면이다.

    지금 당장 점검할 3가지

    첫째, 올해 예정된 하드웨어 교체·증설이 있다면 가격이 더 오르기 전에 앞당길지 검토한다. 둘째, 주요 공급사와 물량·단가를 미리 확정하거나 최소한의 안전재고를 확보한다. 셋째, 클라우드 계약 갱신 시 메모리발 단가 인상 가능성을 예산에 미리 반영한다. 반대로 D램·SSD 판매·유통이 사업이라면, 지금은 재고 자체가 수익이 되는 드문 시기다.

    AI Biz Insider 분석 — AI 도입 논의는 대개 소프트웨어와 모델에 집중되지만, 실제 청구서는 하드웨어와 인프라에서 날아온다. 올해 IT 예산을 짤 때 ‘메모리 인플레이션’을 별도 항목으로 잡아두는 것만으로도 하반기의 예상치 못한 비용 충격을 크게 줄일 수 있다.


    잔치 뒤의 리스크: 사이클과 소송

    호황에는 그림자가 따른다. 메모리는 역사적으로 극심한 호황과 불황을 오가는 사이클 산업이다. 팹 증설에는 오랜 시간과 막대한 비용이 들고, 공급이 늘어나는 시점에 수요가 꺾이면 공급 과잉과 가격 폭락으로 이어진다. 지금의 ‘RAMageddon’이 언젠가 역방향으로 뒤집힐 수 있다는 뜻이다.

    규제 리스크도 커졌다. 6월 25일 미국 캘리포니아 북부지방법원에는 삼성전자·SK하이닉스·마이크론을 상대로 한 반독점 집단소송이 제기됐다. 원고 측은 세 회사가 약 90%의 점유율을 앞세워, HBM 전환을 명분으로 DDR3·DDR4 같은 구형 D램 생산을 줄여 공급을 인위적으로 죄고 4년간 가격을 약 700% 끌어올렸다고 주장한다(셔먼법 1조 위반, 3배 배상 청구). 다만 이는 원고 측 주장일 뿐 법정에서 검증되지 않았고, 세 회사는 “고수익 HBM으로 생산능력을 재배치한 독립적 경영 판단”이라고 반박한다. 과거 1999~2002년 D램 가격담합 유죄(삼성 3억 달러·하이닉스 1억 8,500만 달러 벌금) 전례가 있는 반면, 2018년 유사 소송은 기각된 바 있어 결과는 예단하기 어렵다.

    AI Biz Insider 분석 — 조달 담당자에게 주는 교훈은 분명하다. ‘가격은 계속 오른다’는 가정에 전부를 걸지 말 것. 사이클 반전과 규제 변수는 언제든 가격 방향을 바꿀 수 있으므로, 장기 계약과 단기 유연성을 함께 쥐는 균형이 필요하다.

    관련 글

    출처

    1. TechCrunch — Why Wall Street thinks US memory maker Micron is the next Nvidia (2026.06.28)
    2. Tech Times — Samsung, SK hynix, and Micron Hit With U.S. Price-Fixing Class Action Over Memory Shortage (2026.06.30)
    3. Reuters — Micron overtakes Meta market value amid relentless AI infrastructure demand (2026.06.25)

    AI Biz Insider · AI 비즈니스 · aibizinsider.com

  • 출퇴근만 했는데 돈 꽂힌다?

    K-패스 대중교통비 환급 제도 안내 이미지
    핵심 정리
    • 버스·지하철을 한 달에 15회 이상만 타면, 쓴 교통비의 20~53%를 다음 달에 현금처럼 돌려받는다. 하루 2회·월 최대 60회까지 인정된다.
    • 환급률은 신분에 따라 다르다. 일반 20%, 청년(만 19~34세) 30%, 저소득층 53.3%. 2024년 이용자 평균 환급액은 한 달 1만 8천 원이었다.
    • 2026년에는 65세 이상 ‘어르신 유형'(30%)이 새로 생겼고, 아무리 많이 타도 초과분까지 돌려주는 무제한 정액형 ‘모두의 카드’가 등장했다.
    • 소득 심사도, 신청 마감도 없다. 참여 카드사에서 카드를 만들고 K-패스 앱·누리집에 등록만 하면 끝이다.

    매일 버스와 지하철로 출퇴근하면서도, 정작 그 교통비의 일부를 나라가 돌려준다는 사실은 모르고 지나치는 사람이 많다. K-패스는 화려한 신규 지원금이 아니라, 이미 쓰고 있는 돈의 일부를 매달 자동으로 되돌려주는 제도다. 그래서 한 번 세팅해두면 신경 쓸 일도 없이 통장에 환급금이 쌓인다. 2026년에는 어르신 유형과 무제한 ‘모두의 카드’까지 더해지면서 혜택의 폭이 한층 넓어졌다. 내가 얼마를, 어떻게 돌려받을 수 있는지 지금부터 하나씩 정리한다.

    K-패스, 대체 얼마를 돌려받나

    K-패스의 원리는 단순하다. 대중교통을 정기적으로 이용하면 그 요금의 일정 비율을 다음 달에 돌려주는 ‘후불 환급형’ 교통카드다. 2024년 5월 시행 이후 2024년 말 기준 265만 명이 사용할 만큼 빠르게 자리를 잡았고, 국토교통부에 따르면 이용자 한 명이 평균적으로 한 달에 1만 8천 원을 돌려받았다. 연간으로 환산하면 20만 원이 넘는 돈이다.

    핵심 규칙 — 월 15회, 최대 60회, 다음 달 환급

    환급을 받으려면 한 달에 대중교통을 15회 이상 이용해야 한다. 이 조건을 넘기면 하루 최대 2회, 월 최대 60회까지의 이용분에 대해 환급률이 적용되고, 그 금액이 다음 달에 지급된다. 시내버스와 광역버스는 물론 신분당선, GTX 같은 도시·광역철도까지 포함되며, 하루에 여러 번 탔다면 요금이 높은 순으로 2건이 인정된다. 즉 출퇴근으로 지하철과 버스를 오가는 직장인이라면 별다른 노력 없이 조건을 채우게 된다.

    내 환급률은 몇 퍼센트일까

    환급률은 이용자의 신분에 따라 차등 적용된다. 일반 이용자는 20%, 만 19~34세 청년은 30%, 기초생활수급자·차상위계층 등 저소득층은 53.3%를 돌려받는다. 여기에 자녀가 2명이면 30%, 3명 이상이면 50%가 적용되는 다자녀 유형, 그리고 2026년 신설된 65세 이상 어르신 유형(30%)이 더해진다. 예를 들어 1회 1,500원짜리 대중교통을 한 달 60회 탄다면 총 9만 원을 쓰는데, 일반은 1만 8천 원, 청년은 2만 7천 원, 저소득층은 약 4만 8천 원을 돌려받는 셈이다.

    정책 분석 — K-패스의 진짜 강점은 ‘지출을 조건으로 하지 않는다’는 점이다. 별도의 추가 소비 없이, 어차피 나갈 교통비의 일부를 돌려주는 구조이기 때문에 실질적으로 손해 볼 일이 없다. 특히 청년과 저소득층은 환급률이 높아, 교통비 비중이 큰 사회초년생일수록 효과가 크다.


    2026년, 무엇이 새로 생겼나

    2026년 K-패스는 대상과 방식 양쪽에서 확장됐다. 국토교통부는 기존 일반·청년·저소득·다자녀 유형에 더해 어르신 유형을 신설하고, 정액형 무제한 패스를 새로 선보였다. 참여 지역도 218개 기초 지자체로 늘어 지방 거주자의 사각지대를 줄였다.

    65세 이상 ‘어르신 유형’ 신설

    그동안 일반 이용자와 동일하게 20%만 적용받던 65세 이상 고령층에 대해, 2026년부터 별도의 어르신 유형이 만들어져 환급률이 30%로 올랐다. 지하철 무임승차 연령이 아닌 버스 이용이 많은 어르신에게 특히 도움이 되는 변화다.

    무제한 정액형 ‘모두의 카드’ 등장

    기존 K-패스는 월 60회까지만 환급했지만, 2026년 도입된 ‘모두의 카드’는 월 환급 기준금액을 초과해 쓴 금액까지 모두 돌려주는 무제한 방식이다. 별도 신청 없이 시스템이 이용자에게 가장 유리한 혜택을 자동으로 계산해 적용하며, 수도권과 지방, 신분당선·GTX까지 전국의 대중교통을 아우른다. 지역 인프라를 고려해 수도권·일반 지방권·우대·특별지원지역 등 4개 권역으로 기준금액을 차등했고, 1회 요금 3천 원 미만 수단 중심의 ‘일반형’과 GTX 등 모든 수단을 포함하는 ‘플러스형’ 중에서 선택할 수 있다.

    정책 분석 — ‘모두의 카드’는 환급형에서 정액·무제한형으로 무게 중심을 옮긴 시도다. 장거리 광역 통근자나 GTX 이용자처럼 교통비 지출이 큰 사람에게는 기존 환급 상한(월 60회)이 아쉬웠는데, 무제한 방식은 이 상한을 사실상 없앤다. 다만 이용 패턴에 따라 유리한 방식이 다르므로, 가입 전 예상 환급금 비교가 필수다.


    어떻게 신청하나

    K-패스는 소득 심사나 신청 마감이 없는 상시 제도다. 절차도 어렵지 않아 한 번만 설정하면 이후에는 자동으로 환급이 이뤄진다.

    카드 발급, 앱 등록, 자동 환급까지 3단계

    먼저 참여 카드사에서 K-패스 카드를 발급받는다. 신한·국민·우리·현대·삼성·농협·하나·IBK기업은행·케이뱅크·토스 등 13개 카드사에서 신용·체크·모바일 형태로 총 32종의 카드가 나와 있다. 카드를 받은 뒤 K-패스 앱이나 누리집에 회원가입하고 카드를 등록하면 준비가 끝난다. 이후에는 대중교통을 이용할 때마다 실적이 자동으로 집계되고, 조건을 충족하면 다음 달에 환급금이 지급된다. 이미 K-패스를 쓰고 있다면 기존 카드를 그대로 사용하면 된다.

    다자녀·저소득은 ‘유형 인증’을 꼭

    높은 환급률을 받으려면 본인이 해당 유형임을 인증해야 한다. 다자녀 가구는 앱·누리집의 ‘My 메뉴 다자녀 정보’에서 실시간 검증으로 인증하는데, 세대주가 아니거나 부모와 자녀의 주소지가 다르면 가족관계증명서 등 증빙서류를 등록해야 한다. 환급률 상향은 검증이 완료되거나 서류가 최종 확인된 시점부터 적용되므로, 가입 직후 바로 인증해두는 것이 유리하다.

    정책 분석 — 가장 흔한 실수가 ‘카드만 만들고 앱 등록·유형 인증을 안 하는’ 경우다. 카드 발급과 K-패스 회원 등록은 별개이며, 유형 인증을 미루면 그 기간의 환급은 낮은 일반 요율로 계산된다. 가입 첫날 앱에서 유형 인증과 예상 환급금 계산기를 함께 확인하는 것을 권한다.


    자주 묻는 질문

    Q1. 지방에 살아도 받을 수 있나요?

    네. K-패스 참여 지역은 2026년 기준 218개 기초 지자체로 확대됐습니다. 강원 고성, 경북 예천 등이 새로 합류했고, 경기(The경기패스)·인천(I-패스)처럼 지자체가 혜택을 더 얹어주는 맞춤형 K-패스를 운영하는 곳도 있습니다. 본인 주소지가 참여 지역인지 K-패스 앱·누리집에서 먼저 확인하면 됩니다.

    Q2. 한 달에 몇 번 안 타면 아예 못 받나요?

    월 15회 미만으로 이용하면 그 달은 환급 대상에서 제외됩니다. 다만 가입 첫 달은 이용 횟수와 관계없이 환급을 인정해주며, 15회를 넘긴 달부터는 최대 60회까지 자동으로 계산됩니다. 출퇴근이나 등하교로 평일에만 타도 대부분 15회는 어렵지 않게 넘깁니다.

    Q3. 이미 K-패스를 쓰는데 2026년 혜택을 따로 신청해야 하나요?

    어르신 유형이나 무제한 ‘모두의 카드’ 같은 새 혜택을 원한다면 해당 유형·카드로 전환·인증하는 절차가 필요합니다. 기본 환급은 기존 카드로 계속 유지되지만, 65세 이상 어르신 유형 상향이나 다자녀 요율은 앱에서 유형 인증을 해야 반영됩니다. 큰 변화가 있었으니 올해 한 번은 앱에 접속해 내 유형과 예상 환급금을 점검하는 것이 좋습니다.


    관련 글

    출처

    1. 대한민국 정책브리핑(국토교통부) — 2026년 K-패스 혜택이 역대급으로 커진다! (2025.12.24)
    2. 대한민국 정책브리핑(국토교통부) — ‘K-패스’ 다자녀 가구 유형 신설, 3자녀 이상 50% 환급 (2025.01.03)
    3. K-패스 공식 누리집·앱 — 예상 환급금 계산기 및 참여 카드사 안내

    AI Biz Insider · 내 삶에 닿는 정책 · aibizinsider.com

AI Biz Insider

AI 비즈니스 뉴스와 테크 트렌드를 매일 빠르고 정확하게 전하는 인사이더 미디어

콘텐츠로 건너뛰기 ↓