Вы создали крутое видео в Runway или Sora. Картинка огонь, движение плавное, эмоции на месте. Но оно немое. Теперь нужно часами искать звуковые эффекты в библиотеках, синхронизировать их вручную, добавлять амбиент. К моменту финального рендера вдохновение уже испарилось.
Mirelo привлёк $41M для озвучивания фильмов.
Проблема тишины
Основатели этого проекта заметили парадокс: текст, изображения, видео генерируются мгновенно, а звук остался в каменном веке. Добавить качественную озвучку к AI-видео — задача на несколько часов ручной работы.
Берлинский стартап построил собственные модели для генерации звуковых эффектов, синхронизированных с видео. Загружаете ролик, через несколько секунд получаете подходящий саундтрек: шаги в такт движению, хлопанье дверей точно в момент закрытия, фоновый шум улицы.
В мае 2025 года вышла модель Mirelo SFX v1.5, которая генерирует несколько вариантов звукового сопровождения быстрее реального времени. Команда из 10 человек планирует утроиться к концу 2026 года.
Секрет скорости
Mirelo тренирует модели с нуля на лицензированных данных. Система требует в 50 раз меньше вычислений, чем типичные большие языковые модели. Алгоритм понимает не только что происходит на экране, но и эмоциональный контекст: тревожная сцена получит напряжённое звуковое сопровождение, весёлая — лёгкое и динамичное.
Платформа доступна через веб-приложение Mirelo Studio и API для разработчиков. Целевая аудитория — создатели контента, игровые студии и компании, работающие с AI-видео.
Почему сейчас
Пока Mirelo был в режиме stealth, Sony, Tencent и ElevenLabs выпустили свои решения для генерации звука. Китайский Kling AI от Kuaishou тоже добавил эту функцию. Google встроил звук в Gemini через модель Veo 3.1.
Но Mirelo фокусируется на узкой специализации: звуковые эффекты для видео, а не универсальная генерация аудио. Глубина лучше ширины.
Механика роста
API позволяет платформам вроде Runway или Pika встроить озвучку в один клик. Если Mirelo станет стандартом для нескольких крупных платформ генерации видео, уйти будет сложно — разработчики не захотят переделывать интеграцию.
Как заработать
Постройте сервис для подкастеров: автоматическая озвучка визуальных элементов, фоновые звуки, музыкальные переходы. API Mirelo + интерфейс для неспециалистов.
Создайте маркетплейс звуковых эффектов, сгенерированных под конкретные видео. Креаторы загружают ролики, платформа предлагает пакеты звуков.
Для России: адаптируйте под Яндекс.Музыку и VK Video. Локальные платформы ищут способы конкурировать с YouTube.
Кто еще делает похожее
- ElevenLabs — генерация речи и звука, но больше фокус на голосах
- Boomy — музыкальная генерация, не звуковые эффекты для видео
- Kling AI — китайский конкурент, интегрирован в Kuaishou
- Runway Gen-Audio — генерация звука в Runway, но пока базовая
- Veo 3.1 — Google встроил в Gemini, но это часть большой экосистемы
- AudioLDM — открытая модель, качество ниже
Mirelo выигрывает специализацией: лучшая синхронизация видео и звука на рынке, меньше вычислений, быстрее результат.













