
- DeepL이 텍스트 번역을 넘어 실시간 음성 번역 솔루션 ‘DeepL Voice’를 정식 출시했다
- 독립 벤치마크에서 전문 언어학자 96%가 기존 경쟁사보다 DeepL Voice를 선호한다고 평가했다
- Zoom, Microsoft Teams, Google Meet 통합 지원 — 13개 음성 언어 + 33개 자막 언어 대응
- 기업가치 $2B, 연매출 $185M, 50만 기업 고객 — $5B 규모 IPO를 검토 중이다
4월 16일, 독일 쾰른에 본사를 둔 AI 번역 기업 DeepL이 첫 번째 음성 번역 솔루션 ‘DeepL Voice’를 정식 출시했다. 텍스트 번역 시장의 강자가 실시간 음성 번역이라는 전혀 새로운 전장에 본격적으로 뛰어든 것이다. CEO Jarek Kutylowski는 “언어 AI는 이제 핵심 인프라가 되고 있다. 정확성과 안정성은 기능이 아니라 요구사항”이라고 선언했다.
DeepL Voice: 텍스트 강자의 음성 시장 진출
두 가지 제품 라인업
DeepL Voice는 ‘Voice for Meetings’와 ‘Voice for Conversations’ 두 가지 제품으로 구성된다. Voice for Meetings는 Zoom, Microsoft Teams, Google Meet에 직접 통합되어 회의 중 실시간으로 자막과 번역을 제공한다. Voice for Conversations는 모바일과 웹 기반의 1:1 또는 그룹 대화를 위한 솔루션으로, 현장 근무자를 위한 커스텀 앱 구축에도 활용할 수 있다.
13개 음성 언어, 33개 자막 언어
출시 시점 기준으로 영어, 독일어, 일본어, 한국어, 스웨덴어, 네덜란드어, 프랑스어, 터키어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 이탈리아어 등 13개 언어의 음성 번역을 지원한다. 번역된 자막은 DeepL Translator가 지원하는 33개 전체 언어로 제공된다. 특히 산업 전문 용어나 회사명, 개인명 같은 커스텀 어휘를 학습시킬 수 있다는 점이 기업 고객에게 핵심 차별점이다.
96%의 전문가가 인정한 번역 품질
독립 벤치마크가 증명한 압도적 수치
번역 산업 전문 리서치 기관 Slator의 독립 벤치마크에 따르면, 전문 언어학자의 96%가 블라인드 평가에서 DeepL Voice를 경쟁사보다 선호했다. 구체적인 수치를 보면 번역 품질 점수에서 Zoom 환경 96.4점, Teams 환경 96.3점을 기록했다. 경쟁사는 87~89점에 머물렀다. 치명적 오류(critical error)는 경쟁사 대비 76% 적었고, 완전 통과 세그먼트(fully passing segments) 비율은 79%로 경쟁사의 42%를 크게 앞섰다.
자막 안정성이라는 숨은 경쟁력
실시간 번역에서 번역 정확도만큼 중요한 것이 자막 안정성이다. 자막이 계속 깜빡이거나 변경되면 회의 참가자의 집중력이 떨어진다. DeepL Voice의 자막 안정성 점수는 Zoom 환경 88.6점, Teams 환경 85.8점으로, 자막 깜빡임(flicker)이 Teams 대비 37.6%, Zoom 대비 54.7% 줄었다. 회의 중 실제 사용 경험에서 체감되는 차이가 크다는 의미다.
AI Biz Insider 분석 ― DeepL의 진짜 무기는 기술 스택 전체를 자체 통제한다는 점이다. 현재는 음성-텍스트-번역-음성의 파이프라인 구조이지만, 텍스트 단계를 건너뛰는 엔드투엔드 음성 번역 모델을 개발 중이라고 밝혔다. 이 전환이 완성되면 지연 시간이 대폭 줄어들어 실시간 ‘동시통역’에 한 걸음 더 가까워진다. 연매출 $185M, 50만 기업 고객이라는 탄탄한 B2B 기반 위에 $5B 규모 IPO까지 검토 중인 만큼, 이 기술 전환은 단순한 제품 확장이 아니라 기업가치를 2.5배 끌어올리기 위한 전략적 포석으로 읽힌다.
비즈니스 임팩트: $2B에서 $5B으로
숫자가 말하는 성장 궤적
DeepL은 2017년 설립 이후 Benchmark, IVP, Index Ventures 등 글로벌 톱티어 VC로부터 총 $536M을 투자받았다. 2024년 5월 Series C에서 $300M을 유치하며 기업가치 $2B를 찍었고, 같은 해 연매출은 $185.2M(전년 대비 31% 성장)을 기록했다. 현재 직원 수 1,000명 이상, 기업 고객 20만 팀 이상이 사용 중이며, 2025년 10월에는 $5B 규모의 IPO를 검토 중이라는 보도가 나왔다.
통역 시장을 넘어선 API 전략
DeepL은 Voice API도 함께 공개했다. 외부 개발자와 기업이 DeepL의 음성 번역 기술 위에 커스텀 솔루션을 구축할 수 있다. 대표적 활용 사례가 콜센터다. 해당 언어를 구사하는 직원을 채용하기 어렵고 비용이 높은 시장에서, AI 번역 레이어 하나로 다국어 고객 지원이 가능해진다. 이는 단순 회의 번역 도구를 넘어 글로벌 B2B SaaS 플랫폼으로의 확장을 의미한다.
한국어 지원과 시사점
주목할 점은 DeepL Voice가 출시 첫날부터 한국어 음성 번역을 지원한다는 것이다. 13개 지원 언어에 한국어가 포함되어 있어, 한국 기업의 글로벌 화상 회의에서 즉시 활용할 수 있다. 일본어도 동시 지원되므로 한일 비즈니스 커뮤니케이션에서 통역 비용을 대폭 절감할 수 있는 가능성이 열렸다. 국내 통역 시장의 평균 시간당 단가(10~30만원)를 고려하면, 다국적 회의가 잦은 기업에게 비용 효과는 상당할 것으로 예상된다.
관련 글
- 마케팅팀 전원 해고됐습니다. 이유가 소름입니다
- 4개월 만에 매출 3배…Anthropic이 한 짓
- 같은 날 같은 걸 냈다…OpenAI와 Google 사이에 무슨 일이?
- Mac 유저 전원 해당. Google이 어제 한 짓
출처
- TechCrunch — DeepL, known for text translation, now wants to translate your voice (2026.04.16)
- PR Newswire — DeepL Voice preferred by 96% of professional linguists (2026.03.25)
AI Biz Insider · AI 비즈니스 · aibizinsider.com

댓글 남기기