
- 마이크로소프트가 Build 2026(6월 2일)에서 온디바이스 AI 모델군 ‘Aion 1.0’을 공개했다. 클라우드 없이 PC 안에서 도는 것이 핵심이다.
- Aion 1.0 Plan은 140억(14B) 파라미터·32K 맥락의 추론 모델로, 도구 호출·파일 관리·하위 에이전트 지휘를 기기에서 수행한다.
- 소형 모델 Aion 1.0 Instruct는 이미 엣지 인사이더에서 미리보기 중이며, 7월에 가중치를 허깅페이스에 오픈소스로 공개한다.
- 나델라의 키워드는 ‘언메터드 인텔리전스’ — 토큰 미터기에서 벗어나는 전략이다. 단, Plan은 ‘향후 몇 달 내’ 로드맵 항목이다.
지난 3년간 ‘윈도우의 AI’란 사실상 클라우드로 연결되는 버튼 하나였다. 무언가를 물으면 신호가 데이터센터를 오갔다. 그런데 마이크로소프트가 Build 2026에서 그 구도를 뒤집었다. AI를 클라우드가 아니라 PC 안으로, 운영체제 그 자체로 끌어내린 것이다. 그 중심에 ‘Aion 1.0’이 있다.
Aion 1.0, PC 안으로 들어온 AI 가족
마이크로소프트는 6월 2일 Build 2026에서 온디바이스 AI 모델군 ‘Aion 1.0’을 공개했다. 덩치 큰 모델 하나를 노트북에 욱여넣는 방식이 아니라, 일의 난이도에 따라 크기가 다른 두 모델로 나눈 것이 특징이다.
Aion 1.0 Instruct — 일상 작업용 소형 모델
요약·문장 다듬기·사용자 의도 파악·접근성 기능 같은 고빈도 작업을 즉시, 그리고 기기 안에서 처리하는 소형 언어 모델(SLM)이다. 기존 윈도우 내장 SLM을 대체하며 ‘더 작고 빠르고 효율적’이라고 소개됐다. 미리보기는 이미 엣지 인사이더(Edge Insider) 채널에서 쓸 수 있고, 7월에는 가중치를 허깅페이스에 오픈소스로 공개한다. 개발자가 자기 데이터로 미세조정해 제품에 넣을 수 있다는 뜻이다. 다만 Instruct의 정확한 파라미터 수는 공개되지 않았다.
Aion 1.0 Plan — PC에서 도는 14B 추론 모델
진짜 주목할 건 Plan이다. 140억(14B) 파라미터, 32K 맥락 창을 갖춘 추론·도구 호출 모델로, 마이크로소프트의 설명이 의미심장하다. “사용자 의도를 추론하고, 도구를 호출하고, 파일을 관리하고, 하위 에이전트를 지휘한다.” 챗봇이 아니라 에이전트의 동사들이다. 게다가 이 모든 걸 클라우드가 아니라 기기 안에서 실행하며, 호환 기기에는 윈도우에 기본 내장(in-box)되어 배포된다. 다만 Plan은 ‘향후 몇 달 내’라는 로드맵 항목이지, 당장 쓸 수 있는 제품은 아니다.
Trend Insight — ‘발표’와 ‘출시’ 사이의 간극은 그동안 수많은 온디바이스 AI가 사라진 무덤이기도 하다. Plan은 약속이지 아직 현실이 아니라는 점을 기억해 둘 필요가 있다.
왜 ‘온디바이스’가 핵심인가 — 언메터드 인텔리전스
사티아 나델라가 발표를 관통하는 키워드로 꺼낸 말은 ‘언메터드 인텔리전스(unmetered intelligence)’, 즉 ‘계량되지 않는 지능’이다. 일의 난이도에 따라 AI가 도는 장소를 세 단계로 나눈다. 가벼운 작업은 기기 안의 Aion SLM이, 중간 작업은 로컬 고성능 칩(RTX Spark급)이, 프런티어 추론만 클라우드가 맡는다.
핵심은 ‘미터기’다. 토큰당·요청당 과금되는 클라우드 모델은 모든 AI 기능을 비용 항목으로 만든다. 고빈도·저난도 작업을 사용자가 이미 가진 하드웨어로 내리면 그 부분이 미터기에서 통째로 빠진다. 실제로 윈도우 코파일럿 런타임의 온디바이스 추론에는 호출당 추가 비용이 없다.
에이전트를 기기 안에서 돌릴 때 이점은 세 가지다. 민감한 파일이 기기를 떠나지 않고(프라이버시), 계획 루프가 네트워크가 아닌 로컬 속도로 돌며(지연), 오케스트레이션 오버헤드가 클라우드 청구서에서 사라진다(비용). 그동안 에이전트 AI가 현장에서 ‘미덥지 않다’고 느껴지게 만든 바로 그 마찰 지점들이다.
Trend Insight — 지난 3년간 AI의 무게중심은 ‘더 큰 데이터센터의 더 큰 모델’로 쏠렸다. 마이크로소프트는 정반대 방향에 깃발을 꽂았다. 클라우드를 버리는 게 아니라, 균형을 다시 맞추는 쪽으로.
윈도우 전체가 바뀐다 — 그리고 한계
Aion 외에도 조용한 변화가 많다. 새 윈도우 음성 인식 API는 기기 안에서 실시간 음성-텍스트 변환을 처리한다(공개 미리보기, 출시 시점엔 영어만 지원). 기존 내장 SLM ‘파이 실리카(Phi Silica)’는 NPU 전용에서 GPU까지 확장됐고, 영상 초해상도와 음성 인식은 CPU에서도 돌게 됐다. 윈도우 코파일럿 런타임 API가 NPU에서 GPU, CPU 순으로 최적 하드웨어를 자동 선택하므로, 개발자는 코드 한 갈래만 작성하면 된다.
CEO·개발자가 점검할 포인트
첫째, 하드웨어 게이트가 분명하다. 제대로 된 온디바이스 실행은 사실상 40 TOPS급 NPU(코파일럿+ PC) 기준을 요구하는데, 코파일럿+ PC는 2026년 초 기준 신규 윈도우 PC 판매의 약 25~30%에 불과하다. 따라서 ‘로컬 우선, 클라우드 폴백’ 구조로 설계하는 편이 안전하다. 둘째, 비용 구조가 바뀐다. 반복되는 클라우드 청구서가 일회성 하드웨어 구매로 옮겨가고, 기기를 떠나지 않는 데이터는 전송 중 거버넌스 부담이 줄어든다. 셋째, 경쟁 구도다. 애플은 자사 실리콘에, 구글은 엣지에 온디바이스 AI를 밀어왔지만 마이크로소프트의 차별점은 ‘배포’다. 세계에서 가장 널리 쓰이는 데스크톱 OS에 추론 모델을 기본 탑재한다는 것.
Trend Insight — Aion은 제품 발표라기보다 인프라 선언에 가깝다. 1990년대 마이크로소프트가 DirectX에 걸었던 베팅처럼, ‘온디바이스 AI는 윈도우의 기본 기능’이라는 장기 약속이다.
관련 글
출처
- ThePlanetTools.ai — Microsoft Build 2026: Aion 1.0 On-Device AI for Windows
- ChatForest — Windows AI Models at Build 2026: On-Device Inference
- Windows Forum — Microsoft Aion 1.0: Instruct, Plan, and New APIs
AI Biz Insider · AI 트렌드 · aibizinsider.com
댓글 남기기