Deepgram – платформа голосового ИИ для распознавания и синтеза речи корпоративного уровня. Привлекли $130M Series C при оценке $1,3 млрд.
Как это работает на практике
Модель Nova-3 ошибается на 30% реже конкурентов на технических записях. Обработано 50 тысяч лет звука (не опечатка) и триллион слов. API используют 1,300+ организаций и 200 тысяч разработчиков. Ключевое – компания вышла на плюс в 2025 году. Не прожигают инвестиции, а зарабатывают.
В раунде Deepgram также купил OfOne, стартап из Y Combinator для голосовых заказов в ресторанах. ИИ справляется с заказом без участия человека в 95 случаях из 100. McDonald’s должен волноваться.
Почему рынок взрывается
Рынок распознавания речи вырастет с $8,49 млрд в 2024 до $23,11 млрд к 2030, рост 19,1% ежегодно по данным Markets and Markets. Но настоящий рынок – голосовые агенты. По прогнозам Fortune Business Insights сегмент voice AI достигнет $81,59 млрд к 2032 с ростом 23,1% в год.
Голосовой ИИ в реальном времени требует задержки меньше 500 миллисекунд. Иначе разговор превращается в допрос по рации. Deepgram (и ElevenLabs) – чут ли не единственные, кто стабильно держит эту планку в промышленном масштабе.
Защитный ров из данных
Вертикальная интеграция: распознавание речи Nova плюс синтез Aura плюс API для голосовых агентов. Полный стек.
Lock-in через on-premise развёртывание для регулируемых индустрий. NASA и In-Q-Tel (венчурный фонд ЦРУ) в списке инвесторов – это не случайность. Когда спецслужбы инвестируют, они знают что-то, чего не знаем мы.
Как заработать на этом тренде
Платформа голосовых агентов для корпоративных call-центров – управляемый сервис под ключ.
On-premise лицензирование для здравоохранения, оборонки, финансов – там можно брать премиальный ценник.
Антитренд: парадокс банкоматов для голоса
Парадокс банкоматов показал: автоматизация не уменьшает число кассиров, а увеличивает и вот почему: банкоматы снизили стоимость филиала, филиалов стало больше, кассиров тоже. Voice AI не уничтожит call-центры. Он сделает их дешевле, что приведёт к росту числа точек контакта с клиентами.
Постройте платформу для «AI-augmented human agents». ИИ берёт рутину (проверка баланса, FAQ), люди решают сложные кейсы (жалобы, споры). Общая пропускная способность вырастет в десять раз. Каждый оператор сможет обслуживать не 30, а 300 клиентов в день.
Конкуренты
- AssemblyAI — 200K+ пользователей, хорошая точность, фокус на разработчиках
- Rev.ai — 170K+ клиентов, гибрид человека и ИИ, точность через краудсорсинг
- Speechmatics — 50+ языков, модель Ursa 2, британская точность
- Google Cloud Speech-to-Text — 73 языка, но только облако
- AWS Transcribe — lock-in через экосистему AWS












