벡터DB 쓰는 사람 지금 멈춰

AI 메모리 레이어와 자가 수정 루프, 거버넌스 구조를 표현한 추상 일러스트
DIGEST
  • Supermemory — 사실 추출부터 ‘자동 망각’까지 처리하는 오픈소스 AI 메모리 엔진, 주요 벤치마크 3종 1위
  • Eric Ries AMA — 좋은 회사가 망가지는 건 결심이 아니라 ‘financial gravity’, 답은 리더십이 아닌 구조
  • Fable 5 루프 설계 — 직접 프롬프팅 대신 자가 수정 루프와 메모리, ML 과제에서 Opus 4.7 대비 약 6배 개선

AI는 왜 어제 한 대화를 오늘 기억하지 못할까요. 그리고 좋은 회사는 왜 어느 날 갑자기 낯선 회사가 되어 있을까요. 오늘 GeekNews 상위권에 오른 세 가지 이야기는 전혀 다른 주제처럼 보이지만, 하나의 질문으로 모입니다 — “기억하고, 검증하고, 스스로 고치는 구조를 어떻게 설계할 것인가.” 벡터DB 없이 메모리·RAG·프로필을 단일 API로 묶은 Supermemory, 15년 만에 돌아온 Eric Ries의 신간 AMA, 그리고 Claude Fable 5를 제대로 쓰는 루프 설계법까지 차례로 정리했습니다.

Supermemory — AI에게 ‘잊는 법’까지 가르친 메모리 엔진

기억보다 어려운 건 갱신과 망각

Supermemory는 대화에서 사실(facts)을 자동 추출해 사용자 프로필을 구축하는 AI용 메모리·컨텍스트 레이어입니다. 단순 저장이 아니라 지식의 생애주기 전체를 다룹니다. “방금 SF로 이사함”이라는 발화가 “NYC에 거주함”을 대체해야 한다는 걸 이해하고, “내일 시험 있음” 같은 임시 사실은 날짜가 지나면 만료 처리하는 ‘자동 망각’까지 수행합니다. 모순 처리와 지식 업데이트가 내장된 셈입니다.

구조적으로는 Memory와 RAG를 단일 쿼리로 결합한 Hybrid Search가 핵심입니다. 지식 베이스 문서와 개인화된 컨텍스트를 한 번에 반환하고, 안정적 사실과 최근 활동을 묶은 User Profile을 약 50ms 한 번의 호출로 제공합니다. Google Drive·Gmail·Notion·GitHub를 webhook으로 실시간 동기화하는 커넥터, PDF·이미지(OCR)·비디오(전사)·코드(AST 인식 청킹)를 처리하는 멀티모달 추출기도 내장돼 있습니다. 개발자 입장에서는 벡터DB 설정, 임베딩 파이프라인, 청킹 전략 없이 단일 API로 끝납니다. 단일 바이너리로 localhost:6767에서 바로 동작하고, Ollama 연동 시 완전 오프라인 사용도 가능합니다.

성능 검증도 공격적입니다. LongMemEval 81.6%를 포함해 LoCoMo, ConvoMem 등 AI 메모리 주요 벤치마크 3종에서 1위를 기록했고, 자체 벤치마크 프레임워크 MemoryBench도 함께 공개했습니다. Claude Code·Cursor·VS Code용 MCP 서버, Vercel AI SDK·LangChain·LangGraph용 드롭인 래퍼까지 제공되며 라이선스는 MIT입니다.

Tech Insight — 에이전트 시대의 메모리 경쟁은 ‘얼마나 많이 기억하는가’에서 ‘무엇을 버릴 줄 아는가’로 이동하고 있습니다. Mem0, Stash에 이어 Supermemory까지 — 메모리 레이어가 인프라 표준 자리를 두고 경쟁하는 지금, 직접 벡터DB 파이프라인을 구축하기 전에 이 카테고리를 먼저 검토할 가치가 있습니다.


Eric Ries의 경고 — 좋은 회사는 ‘결심해서’ 망하지 않는다

financial gravity, 미션을 끌어내리는 보이지 않는 힘

‘The Lean Startup’의 저자 Eric Ries가 신간 ‘Incorruptible’ 출간을 계기로 Hacker News에서 AMA를 진행했습니다. 핵심 개념은 ‘financial gravity’. 좋은 기업이 어느 날 악해지기로 결정해서가 아니라, 기업이 세워진 구조가 만들어내는 중력에 서서히 끌려가며 창립 미션에서 멀어진다는 진단입니다. 다리가 무너졌을 때 “중력 때문”이라는 답은 기술적으로 맞지만, 잔해 속 부식된 볼트를 살펴야 원인을 알 수 있다는 비유로 설명합니다.

흥미로운 건 Costco 사례의 재해석입니다. 핫도그 가격 1.5달러를 지킨 일화는 흔히 리더십의 상징으로 인용되지만, Ries는 Wall Street가 Costco의 정신을 해체하려 할 때마다 회사를 지킨 것은 거대한 규모도 리더십도 아닌 독특한 ‘거버넌스 요새(governance fortress)’ 구조였다고 말합니다. 재단이 영리 자회사를 지배하는 Novo Nordisk형 2주체 구조의 기업은 표준 영리기업 대비 50년 생존 확률이 5~6배 높다는 데이터도 인용했습니다. 벤처 투자를 받은 창업자의 약 80%가 IPO 후 3년 이내에 CEO 자리에서 내려온다는 연구를 들며, 오늘날의 거버넌스 ‘모범 관행’ 상당수가 오히려 가치를 파괴한다고 경고합니다.

AI에 대한 시각도 명확합니다. AI는 가치의 증폭기여서 좋은 기업은 더 좋게, 나쁜 기업은 더 나쁘게 만든다는 것. LLM의 최대 강점은 요약이며, “지금 내 조직이 실제로 무엇을 하고 있는가”라는 리더십의 핵심 과제가 곧 요약 문제라는 통찰도 남겼습니다. 다만 AI로 MVP 제작이 빨라져도 진짜 병목은 사람의 머릿속에서 일어나는 학습(learn) 단계라는 점은 변하지 않는다고 강조합니다.

Tech Insight — “mission-driven은 대부분 거짓이고 기껏해야 mission-hopeful”이라는 Ries의 일침은 스타트업 경영자에게 뼈아픈 질문입니다. 미션 선언문을 다듬는 대신, 비즈니스 모델과 미션을 100% 정렬시키는 구조적 장치(mission drive)를 엔진처럼 설치·정비하라는 관점 전환이 이 책의 본질입니다.


Fable 5 활용법 — 프롬프트를 멈추고 루프를 설계하라

자가 수정 루프와 메모리, 두 개의 레버

Anthropic의 Mythos급 모델 Claude Fable 5를 제대로 활용하는 방법으로 LangChain의 Lance Martin이 두 가지 기법을 제시했습니다. 첫째는 self-correction loop. 잘 설계된 goal과 rubric이 환경에 피드백을 주입하면, 모델이 실행→피드백 수집→자가 수정을 목표 충족까지 반복합니다. Claude Code의 /goal, Claude Managed Agents의 Outcomes가 이 레시피를 구현한 primitive입니다.

검증 무대는 Parameter Golf — 16MB 아티팩트에 들어가는 최고 성능 모델을 8xH100에서 10분 내 학습시키는 오픈소스 ML 엔지니어링 챌린지입니다. 결과는 Fable 5가 Opus 4.7 대비 학습 파이프라인을 약 6배 더 개선. Opus 4.7이 첫 실험의 작은 성과 이후 동일한 스칼라 조정 템플릿을 반복한 반면, Fable 5는 더 큰 구조적 변경(아키텍처 수준)에 베팅하고 quantization 회귀를 뚫고 회복하는 모습을 보였습니다. 주목할 디테일은 채점 주체입니다. 모델의 self-critique보다 독립된 컨텍스트에서 채점하는 verifier sub-agent가 우수했다는 점은 에이전트 파이프라인을 짜는 모든 개발자에게 적용 가능한 교훈입니다.

둘째 레버는 세션을 가로지르는 outer loop, 즉 메모리입니다. Continual Learning Bench 1.0 측정에서 Sonnet 4.6은 실패 노트를 쌓는 1단계에 머물렀고, Opus 4.7은 불확실성을 표시한 스키마 레퍼런스를 만들었지만 검증 커버리지가 중앙값 약 17%에 그쳤습니다. 반면 Fable 5는 fail→investigate→verify→distill→consult로 이어지는 진행을 완주하며 최대 73%의 검증 커버리지를 기록, 학습 내용을 향후 과제에 쓸 일반 규칙으로 증류해냈습니다.

Tech Insight — “내 일은 루프를 작성하는 것”이라는 한 문장이 이 글의 전부입니다. 매 턴 직접 프롬프팅하고 조종하는 시대에서, 모델이 스스로 수정하고 문맥을 관리하도록 goal·rubric·메모리를 설계하는 시대로 — 개발자의 역할 정의가 바뀌고 있습니다.

관련 글

출처

  1. GitHub — supermemoryai/supermemory
  2. Hacker News — Eric Ries AMA (Incorruptible)
  3. X — Lance Martin, Designing loops with Fable 5
  4. GeekNews — Supermemory 토픽
  5. GeekNews — Fable 5 루프 설계 토픽

AI Biz Insider · Tech Digest · aibizinsider.com


AI Biz Insider에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

코멘트

댓글 남기기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기

AI Biz Insider에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기