Meta Pixel
HenryHenry
5 min read
962 слов

Mirelo привлекает $41M для решения проблемы тишины в AI-видео

Берлинский стартап Mirelo только что получил $41 миллион от Index Ventures и a16z на создание AI-генерируемых звуковых эффектов для видео. При поддержке руководителей Mistral и Hugging Face они создают то, в чем индустрия отчаянно нуждается: интеллектуальный звук для революции немого видео.

Mirelo привлекает $41M для решения проблемы тишины в AI-видео

Каждый раз, когда я генерирую AI-видео, происходит одно и то же. Визуал поражает воображение. Движение плавное. Освещение как в кино. Потом нажимаю play и... ничего. Тишина. Мы живем в эпоху немого кино, и я даже не осознавал этого до сих пор.

Ставка в $41 миллион на звук

Mirelo, берлинский стартап, основанный AI-исследователями, которые к тому же музыканты, только что закрыл seed-раунд на $41 миллион. Инвестицию возглавили Index Ventures и Andreessen Horowitz. Это немалая ставка на аудио.

💡

Общее финансирование Mirelo теперь составляет $44 миллиона, включая предыдущий pre-seed от Atlantic. Список бизнес-ангелов читается как зал славы AI: Артур Менш (CEO Mistral), Томас Вольф (chief science officer Hugging Face) и Буркай Гюр (сооснователь Fal.ai).

Идея элегантна: вы загружаете видео, их AI смотрит его и генерирует идеально синхронизированные звуковые эффекты. Не общую фоновую музыку. Настоящие звуки в стиле foley, которые соответствуют тому, что происходит на экране.

Почему это важно сейчас

Подумайте о ландшафте AI-видео в декабре 2025:

  • Runway Gen-4.5 создает потрясающий визуал, но без нативного звука
  • Sora 2 генерирует клипы до 90 секунд—все немые
  • Veo 3.1 только что добавил звук, но только для определенных функций

Индустрия рванула к фотореалистичной генерации, оставляя позади половину сенсорного опыта. Mirelo заполняет этот пробел.

$41M
Seed-раунд
2-3x
Цель роста команды
€20/мес
План Creator

Как работает Mirelo SFX

Их флагманская модель называется Mirelo SFX v1.5. Из того, что я понял по их API-документации и демо:

  1. Анализ сцены: Модель смотрит ваше видео и определяет объекты, действия и контекст окружения
  2. Временная карта: Она понимает, когда происходят события—закрывается дверь, шаги, разбивается стекло
  3. Генерация звука: AI создает аудио, соответствующее визуальному таймингу и акустическим свойствам
  4. Сведение: Все накладывается слоями с подходящими уровнями и пространственным позиционированием

Результат—это не просто звуковые эффекты, прилепленные к видео. Это аудио, которое ощущается на своем месте.

Вход: AI-видео дождя, бьющего в окно
Выход: Капли дождя с разной интенсивностью, резонанс стекла, фоновый тон комнаты
Результат: Видео внезапно становится реальным

Основатели-музыканты

CJ Simon-Gabriel и Florian Wenzel—оба AI-исследователи и музыканты. Эта комбинация важнее, чем можно подумать.

Музыканты понимают про аудио то, что чистые ML-инженеры могут упустить: тайминг—это все. Звуковой эффект, опоздавший на 50 миллисекунд, ощущается неправильно, даже если вы не можете осознанно определить, почему. Эмоциональный эффект аудио зависит от микроскопической синхронизации.

Их двойной бэкграунд проявляется в продукте. Mirelo не просто генерирует звуки—она генерирует их с музыкальностью.

Стратегия распространения

Mirelo выбирает умный подход к рынку:

КаналНазначениеСтатус
Mirelo StudioПрямое рабочее пространство для авторовДоступно
Fal.aiAPI для разработчиковРаботает
ReplicateАльтернативный доступ к APIРаботает
FreemiumПлан creator €20/месяцДоступно

Распространяясь через Fal.ai и Replicate, они встречают разработчиков там, где они уже строят. Если вы создаете AI-видео пайплайн, вы можете добавить Mirelo в свой стек без перестройки всего.

Конкуренция идет

Mirelo не работает в вакууме:

CompanyStrengthWeakness
MireloСпециализированный фокус + основатели-музыкантыМасштаб стартапа
ElevenLabsДоминирование в голосеМеньше фокуса на SFX
Kling AI (Kuaishou)Интегрированная видеоплатформаМеньше специализации в аудио

Sony, Tencent и ElevenLabs все играют в смежных областях. Но лазерный фокус Mirelo на звуковых эффектах для видео дает им преимущество. Они не пытаются быть всем—они пытаются быть превосходными в одном.

Этика обучающих данных

Одна деталь выделилась для меня: Mirelo берет обучающие данные из публичных и купленных звуковых библиотек, с партнерствами по разделению дохода, которые уважают права артистов.

Это важно. AI-индустрия сталкивается с растущим вниманием к практикам обучающих данных. Mirelo строит этично с самого начала, что может стать конкурентным преимуществом по мере ужесточения регулирования.

Что это значит для авторов

Если вы генерируете AI-видео сегодня, ваш рабочий процесс, вероятно, выглядит так:

  1. Генерируете визуал с Sora/Runway/Veo
  2. Экспортируете в редактор
  3. Вручную добавляете звуковые эффекты из библиотеки
  4. Синхронизируете аудио с видео
  5. Корректируете уровни и тайминг
  6. Экспортируете финальное видео

С Mirelo шаги 3-5 сворачиваются в один API-вызов. Экономия времени быстро накапливается, когда вы производите объем.

Путь к AI-музыке

У Mirelo генерация AI-музыки в дорожной карте. Модель звуковых эффектов—только начало.

Представьте генерацию видео с:

  • AI-визуалом
  • AI-диалогом (ElevenLabs)
  • AI-звуковыми эффектами (Mirelo)
  • AI-саундтреком (будущая Mirelo)

Мы собираем части для полностью синтетических медиа. Волнует или пугает это вас—зависит от того, чем вы зарабатываете на жизнь.

Цены и доступ

Для авторов, желающих попробовать Mirelo:

  • Бесплатный уровень: Ограниченные генерации для тестирования платформы
  • План creator: €20/месяц (~$23.50) для рекомендуемого использования
  • API: Оплата за использование через Fal.ai и Replicate
  • Enterprise: Индивидуальные цены для масштаба

План creator удивительно доступен, учитывая технологию. Сравните это с наймом foley-артиста или лицензированием профессиональных звуковых библиотек.

Мое мнение

Мы так сфокусировались на том, чтобы AI-видео выглядело лучше, что забыли—видео это мультисенсорная среда. Mirelo исправляет это упущение.

💡

Попробуйте загрузить одно из ваших AI-видео на платформу Mirelo. Разница между «до» и «после»—это разница между демо и готовым продуктом.

$41 миллион финансирования показывает, что инвесторы видят ту же возможность. Аудио—не приятная фича, это половина того, что делает видео убедительным.

Эпоха немого кино закончилась в 1927 с The Jazz Singer. Почти век спустя AI-видео переживает свой момент «звукового кино».

Mirelo ставит на то, что они могут стать звуком этой новой эры. Судя по их технологии, команде и таймингу, эта ставка выглядит все более правильной.

Как начать

  1. Посетите mirelo.io, чтобы изучить платформу
  2. Загрузите немое AI-видео
  3. Позвольте Mirelo сгенерировать синхронизированное аудио
  4. Сравните с вашей ручной работой над звуком
  5. Решите, готова ли автоматизация для вашего рабочего процесса

Порог входа низкий. Потенциальная экономия времени высокая. И технология будет только улучшаться по мере использования этих $41 миллионов.

У звука наконец-то есть место за столом AI-видео.

Была ли эта статья полезной?

Henry

Henry

Креативный технолог

Креативный технолог из Лозанны, исследующий точки соприкосновения ИИ и искусства. Экспериментирует с генеративными моделями между сессиями электронной музыки.

Похожие статьи

Продолжите изучение с этими статьями

Понравилась статья?

Откройте для себя больше идей и будьте в курсе наших последних публикаций.

Mirelo привлекает $41M для решения проблемы тишины в AI-видео