
- 구글이 Gemini 3.1 Pro 기반 자율 리서치 에이전트 Deep Research / Deep Research Max를 4월 21일 공개했다
- DeepSearchQA 벤치마크 93.3% 달성 (2025년 12월 66.1% 대비 27.2%p 상승), Humanity’s Last Exam 54.6%
- MCP 프로토콜로 사내 데이터 연결, PDF/CSV/이미지/오디오/영상 멀티모달 입력 지원
- 보고서 한 건당 비용 약 4.8달러(Max 기준), FactSet/S&P Global/PitchBook 등 금융 데이터 파트너십 확보
리서치 보고서 하나 쓰려면 최소 반나절은 잡아야 했다. 자료 찾고, 읽고, 정리하고, 차트 그리고. 그런데 구글이 이걸 AI 에이전트 하나로 끝내겠다고 나섰다. 4월 21일 공개된 Deep Research Max는 “알아서 검색하고, 알아서 분석하고, 알아서 보고서까지 써주는” 자율형 리서치 에이전트다. 단순한 검색 도구가 아니라, 사람처럼 반복적으로 추론하고 검증하는 구조를 가졌다는 게 핵심이다.
Deep Research vs Deep Research Max, 뭐가 다른가
속도 vs 깊이, 두 가지 선택지
구글은 이번에 두 가지 에이전트를 동시에 내놨다. Deep Research는 속도와 효율에 최적화된 버전이다. 인터랙티브한 서비스에 바로 붙여 쓸 수 있도록 지연시간(latency)을 대폭 줄였다. 반면 Deep Research Max는 최대한의 포괄성과 분석 품질을 추구한다. 확장된 테스트 타임 컴퓨트(extended test-time compute)를 활용해 반복적으로 추론하고, 검색하고, 최종 보고서를 다듬는다.
Max의 진짜 활용처는 비동기 워크플로우다. 예를 들어 매일 밤 크론 작업으로 돌려놓으면, 다음 날 아침 애널리스트 팀 책상 위에 기업 실사(due diligence) 보고서가 완성돼 있는 식이다. 보고서 한 건당 비용은 Max 기준 약 4.8달러(90만 입력 토큰 + 8만 출력 토큰), 일반 Deep Research는 약 1.22달러 수준이다.
Trend Insight — 보고서 1건에 5달러 미만이라는 가격은 파괴적이다. 컨설팅펌의 애널리스트 한 명이 하루 8시간 작업하는 인건비와 비교하면, AI 리서치 에이전트의 ROI는 명확하다. 다만 “최종 검증”은 여전히 사람의 몫이다.
벤치마크가 증명하는 성능 도약
DeepSearchQA 93.3%, 6개월 만에 27%p 점프
Deep Research Max의 DeepSearchQA 벤치마크 점수는 93.3%다. 2025년 12월 프리뷰 버전이 66.1%였으니, 6개월 만에 27.2%p나 뛰었다. Humanity’s Last Exam(HLE)에서도 54.6%를 기록해 이전의 46.4%에서 의미 있는 상승을 보였다. 이 수치들은 단순한 정보 검색 정확도를 넘어, 복잡한 다단계 추론 능력의 향상을 의미한다.
구글은 이 성능 향상의 핵심으로 Gemini 3.1 Pro의 추론 파운데이션을 꼽았다. Max는 이 추론 기반 위에 자율 리서치 행동(autonomous research behaviors)을 레이어로 쌓은 구조다. 더 많은 소스를 참조하고, 뉘앙스와 소스 다양성이 개선됐다는 게 구글 측의 설명이다.
Trend Insight — 93.3%라는 숫자는 인상적이지만, 실제 기업 환경에서의 정확도는 데이터 소스 품질에 크게 좌우된다. MCP로 사내 데이터를 연결했을 때 성능이 어떻게 달라지는지가 실전 도입의 핵심 변수다.
MCP 연동과 멀티모달, 기업용 게임체인저
사내 데이터에 직접 연결되는 리서치 에이전트
Deep Research Max가 단순 검색 도구와 결정적으로 다른 점은 MCP(Model Context Protocol) 통합이다. 기업이 보유한 내부 데이터베이스, 문서 저장소, 분석 플랫폼에 직접 연결해서 리서치를 수행할 수 있다. 웹 검색과 사내 데이터 검색을 동시에 돌릴 수도 있고, 웹 접근을 완전히 끄고 사내 데이터만으로 분석할 수도 있다.
입력도 멀티모달이다. PDF, CSV, 이미지, 오디오, 비디오를 조합해서 리서치 맥락으로 제공할 수 있다. 예를 들어 경쟁사의 실적 보고서 PDF와 시장 데이터 CSV, 제품 이미지를 한꺼번에 넣고 “경쟁 분석 보고서 작성해줘”라고 하면 끝이다.
금융 데이터 파트너십의 의미
구글은 FactSet, S&P Global, PitchBook과 MCP 통합 파트너십을 체결했다. 이는 금융 애널리스트가 Deep Research Max로 기업 실사, 산업 분석, 투자 리서치를 수행할 때 프리미엄 금융 데이터에 직접 접근할 수 있다는 의미다. 리서치 에이전트가 단순 요약 도구에서 전문 분석 플랫폼으로 진화하고 있다는 신호다.
Trend Insight — MCP 프로토콜은 Anthropic이 주도해 만든 오픈 표준인데, 구글이 이를 적극 채택했다는 것 자체가 흥미롭다. AI 에이전트 생태계에서 MCP가 사실상의 표준(de facto standard)으로 자리잡고 있음을 보여준다.
네이티브 시각화, 보고서의 완성도를 바꾼다
차트와 인포그래픽을 직접 생성
이전까지 AI 리서치 도구들은 텍스트 보고서만 생성했다. Deep Research Max는 HTML 형식의 차트와 인포그래픽을 보고서 안에 직접 삽입한다. 구글이 “Nano Banana”라고 이름 붙인 시각화 엔진을 통해 복잡한 데이터셋을 동적으로 그래프화한다. 리서치 결과를 바로 경영진 보고에 쓸 수 있는 수준의 아웃풋이 나온다는 뜻이다.
실시간 스트리밍도 지원한다. 에이전트가 리서치를 진행하는 동안 중간 추론 단계를 라이브로 확인할 수 있고, 텍스트와 이미지 출력이 생성되는 대로 받아볼 수 있다. 현재 Gemini App, NotebookLM, Google Search, Google Finance에서 이 기능을 쓸 수 있으며, 곧 Google Cloud를 통해 스타트업과 엔터프라이즈에도 확대될 예정이다.
Trend Insight — “리서치 에이전트”의 경쟁이 본격화되고 있다. OpenAI의 Deep Research, Perplexity의 Pages, 그리고 이제 구글의 Deep Research Max. 2026년은 AI가 단순 질의응답을 넘어 “자율 분석가”로 진화하는 원년이 될 것이다.
관련 글
- Anthropic-AWS 140조원 컴퓨트 딜의 의미
- Google TPU 8t/8i – 에이전트 시대를 위한 두 개의 칩
- OpenAI, 90일간 7개 기업 인수한 이유
- OpenAI 전 CTO Mira Murati의 반격
출처
- Google Blog – Deep Research Max: a step change for autonomous research agents
- SiliconANGLE – Google launches AI research agents powered by Gemini 3.1 Pro
- Tom’s Hardware – Deep Research Max raises the bar for autonomous AI tools
AI Biz Insider · AI 트렌드 · aibizinsider.com
댓글 남기기