Mirelo привлекает $41M для решения проблемы тишины в AI-видео
Берлинский стартап Mirelo только что получил $41 миллион от Index Ventures и a16z на создание AI-генерируемых звуковых эффектов для видео. При поддержке руководителей Mistral и Hugging Face они создают то, в чем индустрия отчаянно нуждается: интеллектуальный звук для революции немого видео.

Каждый раз, когда я генерирую AI-видео, происходит одно и то же. Визуал поражает воображение. Движение плавное. Освещение как в кино. Потом нажимаю play и... ничего. Тишина. Мы живем в эпоху немого кино, и я даже не осознавал этого до сих пор.
Ставка в $41 миллион на звук
Mirelo, берлинский стартап, основанный AI-исследователями, которые к тому же музыканты, только что закрыл seed-раунд на $41 миллион. Инвестицию возглавили Index Ventures и Andreessen Horowitz. Это немалая ставка на аудио.
Общее финансирование Mirelo теперь составляет $44 миллиона, включая предыдущий pre-seed от Atlantic. Список бизнес-ангелов читается как зал славы AI: Артур Менш (CEO Mistral), Томас Вольф (chief science officer Hugging Face) и Буркай Гюр (сооснователь Fal.ai).
Идея элегантна: вы загружаете видео, их AI смотрит его и генерирует идеально синхронизированные звуковые эффекты. Не общую фоновую музыку. Настоящие звуки в стиле foley, которые соответствуют тому, что происходит на экране.
Почему это важно сейчас
Подумайте о ландшафте AI-видео в декабре 2025:
- Runway Gen-4.5 создает потрясающий визуал, но без нативного звука
- Sora 2 генерирует клипы до 90 секунд—все немые
- Veo 3.1 только что добавил звук, но только для определенных функций
Индустрия рванула к фотореалистичной генерации, оставляя позади половину сенсорного опыта. Mirelo заполняет этот пробел.
Как работает Mirelo SFX
Их флагманская модель называется Mirelo SFX v1.5. Из того, что я понял по их API-документации и демо:
- Анализ сцены: Модель смотрит ваше видео и определяет объекты, действия и контекст окружения
- Временная карта: Она понимает, когда происходят события—закрывается дверь, шаги, разбивается стекло
- Генерация звука: AI создает аудио, соответствующее визуальному таймингу и акустическим свойствам
- Сведение: Все накладывается слоями с подходящими уровнями и пространственным позиционированием
Результат—это не просто звуковые эффекты, прилепленные к видео. Это аудио, которое ощущается на своем месте.
Вход: AI-видео дождя, бьющего в окно
Выход: Капли дождя с разной интенсивностью, резонанс стекла, фоновый тон комнаты
Результат: Видео внезапно становится реальнымОснователи-музыканты
CJ Simon-Gabriel и Florian Wenzel—оба AI-исследователи и музыканты. Эта комбинация важнее, чем можно подумать.
Музыканты понимают про аудио то, что чистые ML-инженеры могут упустить: тайминг—это все. Звуковой эффект, опоздавший на 50 миллисекунд, ощущается неправильно, даже если вы не можете осознанно определить, почему. Эмоциональный эффект аудио зависит от микроскопической синхронизации.
Их двойной бэкграунд проявляется в продукте. Mirelo не просто генерирует звуки—она генерирует их с музыкальностью.
Стратегия распространения
Mirelo выбирает умный подход к рынку:
| Канал | Назначение | Статус |
|---|---|---|
| Mirelo Studio | Прямое рабочее пространство для авторов | Доступно |
| Fal.ai | API для разработчиков | Работает |
| Replicate | Альтернативный доступ к API | Работает |
| Freemium | План creator €20/месяц | Доступно |
Распространяясь через Fal.ai и Replicate, они встречают разработчиков там, где они уже строят. Если вы создаете AI-видео пайплайн, вы можете добавить Mirelo в свой стек без перестройки всего.
Конкуренция идет
Mirelo не работает в вакууме:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Специализированный фокус + основатели-музыканты | Масштаб стартапа |
| ElevenLabs | Доминирование в голосе | Меньше фокуса на SFX |
| Kling AI (Kuaishou) | Интегрированная видеоплатформа | Меньше специализации в аудио |
Sony, Tencent и ElevenLabs все играют в смежных областях. Но лазерный фокус Mirelo на звуковых эффектах для видео дает им преимущество. Они не пытаются быть всем—они пытаются быть превосходными в одном.
Этика обучающих данных
Одна деталь выделилась для меня: Mirelo берет обучающие данные из публичных и купленных звуковых библиотек, с партнерствами по разделению дохода, которые уважают права артистов.
Это важно. AI-индустрия сталкивается с растущим вниманием к практикам обучающих данных. Mirelo строит этично с самого начала, что может стать конкурентным преимуществом по мере ужесточения регулирования.
Что это значит для авторов
Если вы генерируете AI-видео сегодня, ваш рабочий процесс, вероятно, выглядит так:
- Генерируете визуал с Sora/Runway/Veo
- Экспортируете в редактор
- Вручную добавляете звуковые эффекты из библиотеки
- Синхронизируете аудио с видео
- Корректируете уровни и тайминг
- Экспортируете финальное видео
С Mirelo шаги 3-5 сворачиваются в один API-вызов. Экономия времени быстро накапливается, когда вы производите объем.
Путь к AI-музыке
У Mirelo генерация AI-музыки в дорожной карте. Модель звуковых эффектов—только начало.
Представьте генерацию видео с:
- AI-визуалом
- AI-диалогом (ElevenLabs)
- AI-звуковыми эффектами (Mirelo)
- AI-саундтреком (будущая Mirelo)
Мы собираем части для полностью синтетических медиа. Волнует или пугает это вас—зависит от того, чем вы зарабатываете на жизнь.
Цены и доступ
Для авторов, желающих попробовать Mirelo:
- Бесплатный уровень: Ограниченные генерации для тестирования платформы
- План creator: €20/месяц (~$23.50) для рекомендуемого использования
- API: Оплата за использование через Fal.ai и Replicate
- Enterprise: Индивидуальные цены для масштаба
План creator удивительно доступен, учитывая технологию. Сравните это с наймом foley-артиста или лицензированием профессиональных звуковых библиотек.
Мое мнение
Мы так сфокусировались на том, чтобы AI-видео выглядело лучше, что забыли—видео это мультисенсорная среда. Mirelo исправляет это упущение.
Попробуйте загрузить одно из ваших AI-видео на платформу Mirelo. Разница между «до» и «после»—это разница между демо и готовым продуктом.
$41 миллион финансирования показывает, что инвесторы видят ту же возможность. Аудио—не приятная фича, это половина того, что делает видео убедительным.
Эпоха немого кино закончилась в 1927 с The Jazz Singer. Почти век спустя AI-видео переживает свой момент «звукового кино».
Mirelo ставит на то, что они могут стать звуком этой новой эры. Судя по их технологии, команде и таймингу, эта ставка выглядит все более правильной.
Как начать
- Посетите mirelo.io, чтобы изучить платформу
- Загрузите немое AI-видео
- Позвольте Mirelo сгенерировать синхронизированное аудио
- Сравните с вашей ручной работой над звуком
- Решите, готова ли автоматизация для вашего рабочего процесса
Порог входа низкий. Потенциальная экономия времени высокая. И технология будет только улучшаться по мере использования этих $41 миллионов.
У звука наконец-то есть место за столом AI-видео.
Была ли эта статья полезной?

Henry
Креативный технологКреативный технолог из Лозанны, исследующий точки соприкосновения ИИ и искусства. Экспериментирует с генеративными моделями между сессиями электронной музыки.
Похожие статьи
Продолжите изучение с этими статьями

Pika 2.5: Доступное AI-видео через скорость, цену и инструменты
Pika Labs выпускает версию 2.5 с быстрой генерацией, улучшенной физикой и инструментами вроде Pikaframes и Pikaffects для работы с видео.
Google вступает в гонку AI-аватаров: Veo 3.1 усиливает Google Vids
Google обновляет Vids с аватарами на Veo 3.1, обещая пользователям в пять раз лучший результат по сравнению с конкурентами. Как это выглядит рядом с Synthesia и HeyGen?

Полное руководство по prompt-инженерии для AI-видео в 2025 году
Освойте искусство создания промптов, которые генерируют впечатляющие AI-видео. Изучите шестислойную систему, кинематографическую терминологию и техники для разных платформ.