Mirelo набра $41M, за да реши проблема с тишината в AI видеата
Берлинският стартъп Mirelo току-що получи 41 милиона долара от Index Ventures и a16z, за да внесе AI-генерирани звукови ефекти във видеото. С подкрепата на ръководители от Mistral и Hugging Face, те градят това, от което индустрията отчаяно се нуждае: интелигентен звук за революцията на безмълвното видео.

Всеки път, когато генерирам AI видео, става едно и също. Визиите са невероятни. Движението е плавно. Светлината е кинематографична. После натискам play и... нищо. Тишина. Живеели сме в ерата на нямото кино, без дори да осъзнавам това до сега.
Залогът от $41 милиона за звука
Mirelo, базиран в Берлин стартъп, основан от AI изследователи, които са и музиканти, току-що затвори seed кръг от $41 милиона. Index Ventures и Andreessen Horowitz водят инвестицията. Това не е малък залог за аудио.
Общото финансиране на Mirelo сега е $44 милиона, включително предишната pre-seed подкрепа от Atlantic. Списъкът с ангел инвеститори изглежда като зала на славата на AI: Arthur Mensch (CEO на Mistral), Thomas Wolf (главен научен директор на Hugging Face) и Burkay Gur (съосновател на Fal.ai).
Идеята е елегантна: качваш видео, техният AI го гледа и генерира перфектно синхронизирани звукови ефекти. Не обща фонова музика. Реално foley аудио, което отговаря на това, което се случва на екрана.
Защо това има значение сега
Помислете за AI видео пейзажа през декември 2025:
- Runway Gen-4.5 прави зашеметяващи визии, но няма нативен звук
- Sora 2 генерира клипове до 90 секунди—всички безмълвни
- Veo 3.1 току-що добави аудио, но само за определени функции
Индустрията спринтира към фотореалистично генериране, докато оставя половината от сетивното изживяване назад. Mirelo запълва тази празнина.
Как работи Mirelo SFX
Техният флагмански модел се казва Mirelo SFX v1.5. От API документацията и демото им:
- Анализ на сцената: Моделът гледа видеото и идентифицира обекти, действия и контекст на средата
- Времево картографиране: Разбира кога се случват събитията—затваряне на врата, стъпки, строшено стъкло
- Генериране на звук: AI създава аудио, което отговаря на визуалния тайминг и акустичните свойства
- Миксиране: Всичко се слага на слоеве с подходящи нива и пространствено позициониране
Резултатът не е просто звукови ефекти, залепени върху видео. Това е аудио, което се чувства като част от него.
Вход: AI-генерирано видео на дъжд, удрящ прозорец
Изход: Капки дъжд с променяща се интензивност, резонанс на стъкло, амбиентен тон на стаята
Резултат: Видеото внезапно се усеща истинскоОснователите музиканти
CJ Simon-Gabriel и Florian Wenzel са едновременно AI изследователи и музиканти. Тази комбинация има значение повече, отколкото мислите.
Музикантите разбират нещо за аудио, което чистите ML инженери може да пропуснат: таймингът е всичко. Звуков ефект, който пристига с 50 милисекунди закъснение, се усеща погрешно, дори ако не можете съзнателно да идентифицирате защо. Емоционалното въздействие на аудиото зависи от микроскопична синхронизация.
Двойният им произход личи в продукта. Mirelo не просто генерира звуци—генерира ги с музикалност.
Стратегията за разпространение
Mirelo взима умен подход към пазара:
| Канал | Цел | Статус |
|---|---|---|
| Mirelo Studio | Директна работна площадка за творци | Налично |
| Fal.ai | API за разработчици | Активно |
| Replicate | Алтернативен API достъп | Активно |
| Freemium | €20/месец creator план | Налично |
Като разпространяват чрез Fal.ai и Replicate, те срещат разработчиците там, където вече градят. Ако създавате AI видео pipeline, можете да добавите Mirelo в stack-а си без да преправяте всичко.
Идва конкуренция
Mirelo не работи във вакуум:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Специализиран фокус + основатели музиканти | Стартъп мащаб |
| ElevenLabs | Доминация в гласа | По-малко SFX фокус |
| Kling AI (Kuaishou) | Интегрирана видео платформа | По-малка аудио специализация |
Sony, Tencent и ElevenLabs всички играят в съседни пространства. Но лазерният фокус на Mirelo върху звукови ефекти за видео им дава предимство. Не се опитват да бъдат всичко—опитват се да бъдат отлични в едно нещо.
Етиката на тренировъчните данни
Един детайл ми направи впечатление: Mirelo получава тренировъчни данни от публични и закупени звукови библиотеки, с партньорства за споделяне на приходи, които зачитат правата на артистите.
Това има значение. AI индустрията е под нарастващ контрол относно практиките с тренировъчни данни. Mirelo изглежда гради етично от основите, което може да стане конкурентно предимство, докато регулациите се затягат.
Какво означава това за творците
Ако генерирате AI видео днес, работният ви процес вероятно изглежда така:
- Генериране на визии със Sora/Runway/Veo
- Експорт в софтуер за редакция
- Ръчно добавяне на звукови ефекти от библиотека
- Синхронизиране на аудио с видео
- Регулиране на нива и тайминг
- Експорт на финалното видео
С Mirelo стъпки 3-5 се свиват в едно API извикване. Спестяването на време се увеличава бързо, когато произвеждате в обем.
Пътят към AI музика
Mirelo има AI генериране на музика в пътната си карта. Моделът за звукови ефекти е само началото.
Представете си генериране на видео с:
- AI-генерирани визии
- AI-генериран диалог (ElevenLabs)
- AI-генерирани звукови ефекти (Mirelo)
- AI-генериран саундтрак (бъдещ Mirelo)
Събираме парчетата за напълно синтетични медии. Дали това ви вълнува или ви плаши вероятно зависи от това какво създавате за препитание.
Цени и достъп
За творци, които искат да опитат Mirelo:
- Безплатно ниво: Ограничени генерирания за тестване на платформата
- Creator план: €20/месец (~$23.50) за препоръчително използване
- API: Плащане за използване чрез Fal.ai и Replicate
- Enterprise: Персонализирани цени за мащаб
Creator планът е изненадващо достъпен предвид технологията. Сравнете това с наемането на foley артист или лицензиране на професионални звукови библиотеки.
Моето мнение
Толкова се фокусирахме върху това да направим AI видеото да изглежда по-добре, че забравихме, че видеото е мултисензорна среда. Mirelo коригира този пропуск.
Опитайте да качите едно от вашите AI-генерирани видеа в платформата на Mirelo. Разликата между преди и след е разликата между демо и доставяемо.
Финансирането от $41 милиона предполага, че инвеститорите виждат същата възможност. Аудиото не е желана функция—то е половината от това, което прави видеото завладяващо.
Ерата на нямото кино приключи през 1927 с The Jazz Singer. Почти век по-късно AI видеото има своя собствен "talkies" момент.
Mirelo залага, че могат да бъдат звукът на тази нова ера. Базирано на технологията, екипа и времето им, този залог изглежда все по-умен.
Как да започнете
- Посетете mirelo.io, за да разгледате платформата
- Качете безмълвно AI видео
- Оставете Mirelo да генерира синхронизирано аудио
- Сравнете с вашата ръчна аудио работа
- Решете дали автоматизацията е готова за вашия работен процес
Бариерата за вход е ниска. Потенциалното спестяване на време е високо. И технологията само ще се подобрява, докато тези $41 милиона се разгръщат.
Звукът най-накрая има място на масата на AI видеото.
Беше ли полезна тази статия?

Henry
Творчески технологТворчески технолог от Лозана, който изследва къде изкуственият интелект среща изкуството. Експериментира с генеративни модели между сесии по електронна музика.
Свързани статии
Продължете да изследвате със свързаните публикации

Pika 2.5: Достъпно AI видео чрез скорост, цена и инструменти
Pika Labs пуска версия 2.5 с бърза генерация, подобрена физика и инструменти като Pikaframes и Pikaffects за работа с видео.
Google Влиза в надпреварата за ИИ аватари: Veo 3.1 преобразува новите аватари в Google Vids
Google надгради ИИ аватарите в Vids с Veo 3.1, обещавайки на потребителите на предприятия пет пъти по-голямо предпочитание спрямо конкурентите. Как стои това в сравнение със Synthesia и HeyGen?

Пълно ръководство за AI видео prompt инженеринг през 2025
Овладейте изкуството да създавате prompts, които генерират зашеметяващи AI видеа. Научете шестслойната рамка, кинематографската терминология и платформено-специфични техники.