[태그:] 양자화
폰에서 AI 돌렸더니…
PrismML Ternary Bonsai가 1.58비트 양자화로 8B 모델을 1.75GB로 줄였다. 아이폰에서 초당 27토큰, 에너지 효율 4배. 온디바이스 AI 시대가 열렸다.

RepoBar GitHub 모니터링, AI 자율교정 모순, Qwen3.5 양자화 함정 — Digest 04/19
RepoBar가 macOS 메뉴 바에서 GitHub 저장소를 실시간 모니터링하고, AI 자율 교정이 구조적으로 실패할 수밖에 없는 이유를 논증한 백서가 공개됐으며, Qwen3.5 하이브리드 아키텍처에서 커뮤니티 균일 양자화가 성능을 파괴하는 원인이 규명됐다.
