Mirelo залучила $41M для вирішення проблеми тиші в AI відео
Берлінський стартап Mirelo щойно отримав 41 мільйон доларів від Index Ventures та a16z, щоб додати AI-генеровані звукові ефекти до відео. За підтримки керівників Mistral та Hugging Face, вони будують те, що галузі відчайдушно потрібно: інтелектуальний звук для революції безмовного відео.

Кожного разу, коли я генерую AI відео, відбувається одне й те саме. Візуалізація приголомшлива. Рух плавний. Освітлення кінематографічне. Потім я натискаю play і... нічого. Тиша. Ми жили в еру німого кіно, і я навіть не усвідомлював це досі.
Ставка в $41 мільйон на звук
Mirelo, берлінський стартап, заснований AI дослідниками, які, до речі, є музикантами, щойно закрив seed раунд на $41 мільйон. Index Ventures та Andreessen Horowitz очолили інвестицію. Це немала ставка на аудіо.
Загальне фінансування Mirelo тепер становить $44 мільйони, включаючи попередню pre-seed підтримку від Atlantic. Список ангел-інвесторів читається як зала слави AI: Arthur Mensch (CEO Mistral), Thomas Wolf (головний науковий директор Hugging Face) та Burkay Gur (співзасновник Fal.ai).
Концепція елегантна: ви завантажуєте відео, їхній AI дивиться на нього і генерує ідеально синхронізовані звукові ефекти. Не загальну фонову музику. Справжнє foley аудіо, яке відповідає тому, що відбувається на екрані.
Чому це важливо зараз
Подумайте про ландшафт AI відео в грудні 2025:
- Runway Gen-4.5 створює приголомшливі візуальні ефекти, але без нативного аудіо
- Sora 2 генерує кліпи до 90 секунд—всі без звуку
- Veo 3.1 щойно додав аудіо, але тільки для певних функцій
Індустрія мчала до фотореалістичної генерації, залишаючи позаду половину сенсорного досвіду. Mirelo заповнює цю прогалину.
Як працює Mirelo SFX
Їхня головна модель називається Mirelo SFX v1.5. З того, що можна зрозуміти з їхньої API документації та демо:
- Аналіз сцени: Модель дивиться на відео і визначає об'єкти, дії та контекст середовища
- Часове картування: Визначає, коли відбуваються події—зачинення дверей, кроки, розбите скло
- Генерація звуку: AI створює аудіо, яке відповідає візуальному часу та акустичним властивостям
- Міксування: Все накладається разом з відповідними рівнями та просторовим позиціонуванням
Результат не просто звукові ефекти, наклеєні на відео. Це аудіо, яке відчувається природним.
Вхід: AI-генероване відео дощу, що б'є по вікну
Вихід: Краплі дощу зі змінною інтенсивністю, резонанс скла, навколишній тон кімнати
Результат: Відео раптом відчувається реальнимЗасновники-музиканти
CJ Simon-Gabriel та Florian Wenzel обидва є AI дослідниками та музикантами. Ця комбінація має більше значення, ніж ви можете подумати.
Музиканти розуміють щось про аудіо, що чисті ML інженери можуть пропустити: час—це все. Звуковий ефект, який приходить на 50 мілісекунд пізніше, відчувається неправильно, навіть якщо ви не можете свідомо визначити чому. Емоційний вплив аудіо залежить від мікроскопічної синхронізації.
Їхнє подвійне походження видно в продукті. Mirelo не просто генерує звуки—генерує їх з музикальністю.
Стратегія розповсюдження
Mirelo використовує розумний підхід до ринку:
| Канал | Призначення | Статус |
|---|---|---|
| Mirelo Studio | Прямий робочий простір для творців | Доступно |
| Fal.ai | API для розробників | Активно |
| Replicate | Альтернативний доступ до API | Активно |
| Freemium | €20/міс creator план | Доступно |
Розповсюджуючи через Fal.ai та Replicate, вони зустрічають розробників там, де вони вже будують. Якщо ви створюєте AI відео pipeline, ви можете додати Mirelo до свого stack без перебудови всього.
Конкуренція наближається
Mirelo не працює у вакуумі:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Спеціалізований фокус + засновники-музиканти | Масштаб стартапу |
| ElevenLabs | Домінування голосу | Менше фокусу на SFX |
| Kling AI (Kuaishou) | Інтегрована відео платформа | Менша аудіо спеціалізація |
Sony, Tencent та ElevenLabs грають у суміжних сферах. Але лазерний фокус Mirelo на звукових ефектах для відео дає їм перевагу. Вони не намагаються бути всім—вони намагаються бути відмінними в одній речі.
Етика тренувальних даних
Один деталь привернула мою увагу: Mirelo отримує тренувальні дані з публічних та куплених звукових бібліотек, з партнерствами для розподілу доходів, які поважають права артистів.
Це важливо. AI індустрія стикається з зростаючим контролем щодо практик тренувальних даних. Mirelo, здається, будує етично з самого початку, що може стати конкурентною перевагою, коли регуляції посиляться.
Що це означає для творців
Якщо ви генеруєте AI відео сьогодні, ваш робочий процес виглядає приблизно так:
- Генерація візуальних ефектів за допомогою Sora/Runway/Veo
- Експорт в програму для редагування
- Ручне додавання звукових ефектів з бібліотеки
- Синхронізація аудіо з відео
- Налаштування рівнів та часу
- Експорт фінального відео
З Mirelo кроки 3-5 згортаються в один API виклик. Економія часу швидко накопичується, коли ви виробляєте в обсязі.
Шлях до AI музики
У Mirelo є AI генерація музики в дорожній карті. Модель звукових ефектів—це лише початок.
Уявіть собі генерацію відео з:
- AI-генерованими візуальними ефектами
- AI-генерованим діалогом (ElevenLabs)
- AI-генерованими звуковими ефектами (Mirelo)
- AI-генерованим саундтреком (майбутній Mirelo)
Ми збираємо частини для повністю синтетичних медіа. Чи хвилює це вас, чи лякає, ймовірно, залежить від того, що ви створюєте для заробітку.
Ціни та доступ
Для творців, які хочуть спробувати Mirelo:
- Безкоштовний рівень: Обмежені генерації для тестування платформи
- Creator план: €20/міс (~$23.50) для рекомендованого використання
- API: Оплата за використання через Fal.ai та Replicate
- Enterprise: Індивідуальні ціни для масштабу
Creator план дивно доступний з огляду на технологію. Порівняйте це з наймом foley художника або ліцензуванням професійних звукових бібліотек.
Моя думка
Ми так зосередилися на тому, щоб AI відео виглядало краще, що забули, що відео—це багатосенсорне середовище. Mirelo виправляє це упущення.
Спробуйте завантажити одне з ваших AI-генерованих відео на платформу Mirelo. Різниця між до та після—це різниця між демо та готовим продуктом.
Фінансування в $41 мільйон свідчить, що інвестори бачать ту саму можливість. Аудіо не є додатковою функцією—це половина того, що робить відео переконливим.
Ера німого кіно закінчилася в 1927 році з The Jazz Singer. Майже століття потому AI відео має свій власний "звуковий" момент.
Mirelo робить ставку на те, що вони можуть стати звуком цієї нової ери. Виходячи з їхньої технології, команди та часу, ця ставка виглядає все розумнішою.
Як почати
- Відвідайте mirelo.io, щоб дослідити платформу
- Завантажте безмовне AI відео
- Дозвольте Mirelo згенерувати синхронізоване аудіо
- Порівняйте з вашою ручною аудіо роботою
- Вирішіть, чи готова автоматизація для вашого робочого процесу
Бар'єр для входу низький. Потенційна економія часу висока. І технологія буде лише покращуватися, коли ті $41 мільйон будуть розгортатися.
Звук нарешті має місце за столом AI відео.
Ця стаття була корисною?

Henry
Креативний ТехнологКреативний технолог з Лозанни, що досліджує перетин ШІ та мистецтва. Експериментує з генеративними моделями між сесіями електронної музики.
Схожі статті
Продовжуйте дослідження з цими схожими публікаціями

Pika 2.5: Доступне AI-відео через швидкість, ціну та інструменти
Pika Labs випускає версію 2.5 зі швидкою генерацією, покращеною фізикою та інструментами як Pikaframes і Pikaffects для роботи з відео.
Google входить в гонку AI-аватарів: Veo 3.1 запускає нові аватари в Google Vids
Google оновив Google Vids аватарами на базі Veo 3.1, збільшивши перевагу в п'ять разів над конкурентами. Як це держиться проти Synthesia та HeyGen?

Повний посібник з інженерії промптів для AI-відео у 2025 році
Опануйте мистецтво створення промптів, які генерують вражаючі AI-відео. Дізнайтеся про шестирівневу структуру, кінематографічну термінологію та специфіку різних платформ.