- Gemma 4 26B를 4비트 양자화한 SuperGemma4가 13GB로 원본 대비 QuickBench 95.8점, 8.7% 빠른 생성 속도를 달성했다
- ChatGPT 계정 OAuth 토큰을 활용해 별도 크레딧 없이 OpenAI API를 로컬에서 사용하는 openai-oauth가 공개됐다
- Karpathy의 autoresearch 아이디어를 범용화한 pi-autoresearch가 모든 최적화 문제에 자율 실험 루프를 적용한다
- 세 프로젝트 모두 ‘대형 AI를 개인 개발자 손에 쥐어주겠다’는 오픈소스 진영의 의지를 보여준다
오늘의 Digest는 개발자들이 직접 AI의 울타리를 허문 세 가지 오픈소스 프로젝트를 다룬다. 구글의 최신 모델을 맥북에서 돌리고, ChatGPT 구독 하나로 API를 무료 사용하며, AI가 스스로 실험을 설계하고 반복하는 세상이 이미 GitHub 위에 펼쳐져 있다.
SuperGemma4 – 13GB로 구글 최신 AI를 맥북에서 돌린다
핵심 요약
SuperGemma4는 구글 Gemma 4 26B IT를 애플 실리콘 MLX에 최적화하고 4비트로 양자화한 텍스트 전용 모델이다. 약 13GB 크기로 압축됐음에도 원본보다 성능이 높다. QuickBench 95.8점(원본 91.4), 코드 생성 98.6점(+6.3), 한국어 프롬프트 95.0점(+4.3)을 기록했다. 생성 속도도 초당 46.2토큰으로 원본 대비 8.7% 빠르다. 비검열(uncensored) 출력을 지원하며, OpenAI 호환 API 서빙이 가능해 로컬 에이전트 워크플로에 바로 통합할 수 있다. BF16과 U32 텐서를 사용하는 Safetensors 포맷이며 mlx_lm.server 명령어로 즉시 배포 가능하다.
AI Biz Insider 분석 ― 양자화 모델이 원본을 능가하는 것은 미세조정과 양자화 기법의 성숙을 보여준다. 특히 한국어 성능이 4.3점 상승한 점은 국내 개발자에게 실질적 의미가 크다. M4 Pro 맥북 한 대면 상용 수준의 로컬 AI 서버를 구축할 수 있는 시대가 열렸다.
openai-oauth – ChatGPT 구독 하나로 OpenAI API를 무료로 쓴다
핵심 요약
openai-oauth는 ChatGPT 계정의 OAuth 토큰을 활용해 별도 API 크레딧 구매 없이 OpenAI API를 사용할 수 있는 오픈소스 도구다. npx openai-oauth 한 줄로 로컬 프록시 서버(http://127.0.0.1:10531/v1)를 띄우면, /v1/responses, /v1/chat/completions, /v1/models 엔드포인트를 스트리밍, 도구 호출, 추론 추적까지 지원한다. Vercel AI SDK Provider로도 TypeScript에서 바로 사용 가능하다. 사전에 npx @openai/codex login으로 인증하면 ~/.codex/auth.json에 토큰이 저장되고 자동 갱신된다. 다만 비공식 커뮤니티 프로젝트이므로 과도한 사용 시 계정 정지 위험이 있으며, 사용 가능한 모델은 본인의 Codex 플랜에 포함된 것으로 제한된다.
AI Biz Insider 분석 ― API 비용 장벽을 OAuth 우회로 낮추는 시도는 이번이 처음이 아니지만, Codex 인프라를 활용한 점이 새롭다. 프로덕션 환경에는 부적합하나, 로컬 프로토타이핑이나 학습 목적으로는 실용적이다. OpenAI가 이 패턴을 허용할지 차단할지 향후 TOS 변경을 주시해야 한다.
pi-autoresearch – AI가 스스로 실험하고 개선하는 무한 루프
핵심 요약
pi-autoresearch는 Andrej Karpathy의 ‘AI 자율 실험’ 아이디어를 범용화한 오픈소스 프로젝트다. 터미널 AI 코딩 에이전트 pi의 확장으로, ‘아이디어 시도 – 측정 – 개선되면 유지, 아니면 폐기 – 반복’이라는 루프를 모든 최적화 문제에 적용한다. 테스트 속도, 번들 크기, 빌드 시간, Lighthouse 점수 등 도메인에 구애받지 않는 메트릭을 지원한다. 세션 상태는 autoresearch.jsonl(추가 전용 로그)과 autoresearch.md(요약)로 관리되며, MAD 기반 신뢰도 점수로 노이즈와 실제 개선을 구분한다(녹색 2.0x 이상, 노랑 1.0-2.0x, 빨강 1.0x 미만). autoresearch.checks.sh로 일관성 검증이 자동화되고, 최종 결과는 독립 git 브랜치로 분리된다. API 키 한도와 maxIterations 파라미터로 토큰 소비를 제어할 수 있다.
AI Biz Insider 분석 ― ‘코드를 짜는 AI’에서 ‘실험을 설계하고 반복하는 AI’로의 전환이 가속되고 있다. MAD 기반 통계적 검증은 AI 자율 최적화의 신뢰성 문제를 정면으로 다룬 점에서 의미 있다. 프론트엔드 성능 튜닝, CI/CD 파이프라인 최적화 등 반복 측정이 가능한 모든 영역에 즉시 적용할 수 있다.
Executive Summary
| 기사 | 키워드 | 실무 액션 | 중요도 |
|---|---|---|---|
| SuperGemma4 | Gemma 4, 양자화, MLX | M-시리즈 맥에서 로컬 AI 서버 구축 테스트 | HIGH |
| openai-oauth | OpenAI, OAuth, API 프록시 | 로컬 프로토타이핑 시 API 비용 절감 수단 검토 | MEDIUM |
| pi-autoresearch | 자율 실험, 최적화, Karpathy | 빌드/테스트 파이프라인에 자율 최적화 루프 도입 검토 | HIGH |
관련 글
- 31B로 400B급을 이겼다…Google이 무료로 푼 AI의 정체
- 350억 중 30억만 깨운다…Qwen이 연 AI 코딩의 새 판 ― Digest 04/17
- 6개월 매출 2배…물리학 박사가 만든 AI 코딩 에이전트, $1.5B 유니콘 등극
- Anthropic Built an AI That Hacks Better Than Humans ― Then Gave Defenders a Head Start
출처
- SuperGemma4 – 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델 (GeekNews)
- openai-oauth – ChatGPT 계정으로 OpenAI API를 무료로 사용하기 (GeekNews)
- pi-autoresearch: Karpathy의 AI 자율 실험 아이디어를 범용화한 오픈소스 (GeekNews)
AI Biz Insider · Tech Digest · aibizinsider.com

댓글 남기기