Meta Pixel
HenryHenry
6 min read
1070 думи

Mirelo набра $41M, за да реши проблема с тишината в AI видеата

Берлинският стартъп Mirelo току-що получи 41 милиона долара от Index Ventures и a16z, за да внесе AI-генерирани звукови ефекти във видеото. С подкрепата на ръководители от Mistral и Hugging Face, те градят това, от което индустрията отчаяно се нуждае: интелигентен звук за революцията на безмълвното видео.

Mirelo набра $41M, за да реши проблема с тишината в AI видеата

Всеки път, когато генерирам AI видео, става едно и също. Визиите са невероятни. Движението е плавно. Светлината е кинематографична. После натискам play и... нищо. Тишина. Живеели сме в ерата на нямото кино, без дори да осъзнавам това до сега.

Залогът от $41 милиона за звука

Mirelo, базиран в Берлин стартъп, основан от AI изследователи, които са и музиканти, току-що затвори seed кръг от $41 милиона. Index Ventures и Andreessen Horowitz водят инвестицията. Това не е малък залог за аудио.

💡

Общото финансиране на Mirelo сега е $44 милиона, включително предишната pre-seed подкрепа от Atlantic. Списъкът с ангел инвеститори изглежда като зала на славата на AI: Arthur Mensch (CEO на Mistral), Thomas Wolf (главен научен директор на Hugging Face) и Burkay Gur (съосновател на Fal.ai).

Идеята е елегантна: качваш видео, техният AI го гледа и генерира перфектно синхронизирани звукови ефекти. Не обща фонова музика. Реално foley аудио, което отговаря на това, което се случва на екрана.

Защо това има значение сега

Помислете за AI видео пейзажа през декември 2025:

  • Runway Gen-4.5 прави зашеметяващи визии, но няма нативен звук
  • Sora 2 генерира клипове до 90 секунди—всички безмълвни
  • Veo 3.1 току-що добави аудио, но само за определени функции

Индустрията спринтира към фотореалистично генериране, докато оставя половината от сетивното изживяване назад. Mirelo запълва тази празнина.

$41M
Seed кръг
2-3x
Цел за растеж на екипа
€20/мес
Creator план

Как работи Mirelo SFX

Техният флагмански модел се казва Mirelo SFX v1.5. От API документацията и демото им:

  1. Анализ на сцената: Моделът гледа видеото и идентифицира обекти, действия и контекст на средата
  2. Времево картографиране: Разбира кога се случват събитията—затваряне на врата, стъпки, строшено стъкло
  3. Генериране на звук: AI създава аудио, което отговаря на визуалния тайминг и акустичните свойства
  4. Миксиране: Всичко се слага на слоеве с подходящи нива и пространствено позициониране

Резултатът не е просто звукови ефекти, залепени върху видео. Това е аудио, което се чувства като част от него.

Вход: AI-генерирано видео на дъжд, удрящ прозорец
Изход: Капки дъжд с променяща се интензивност, резонанс на стъкло, амбиентен тон на стаята
Резултат: Видеото внезапно се усеща истинско

Основателите музиканти

CJ Simon-Gabriel и Florian Wenzel са едновременно AI изследователи и музиканти. Тази комбинация има значение повече, отколкото мислите.

Музикантите разбират нещо за аудио, което чистите ML инженери може да пропуснат: таймингът е всичко. Звуков ефект, който пристига с 50 милисекунди закъснение, се усеща погрешно, дори ако не можете съзнателно да идентифицирате защо. Емоционалното въздействие на аудиото зависи от микроскопична синхронизация.

Двойният им произход личи в продукта. Mirelo не просто генерира звуци—генерира ги с музикалност.

Стратегията за разпространение

Mirelo взима умен подход към пазара:

КаналЦелСтатус
Mirelo StudioДиректна работна площадка за творциНалично
Fal.aiAPI за разработчициАктивно
ReplicateАлтернативен API достъпАктивно
Freemium€20/месец creator планНалично

Като разпространяват чрез Fal.ai и Replicate, те срещат разработчиците там, където вече градят. Ако създавате AI видео pipeline, можете да добавите Mirelo в stack-а си без да преправяте всичко.

Идва конкуренция

Mirelo не работи във вакуум:

CompanyStrengthWeakness
MireloСпециализиран фокус + основатели музикантиСтартъп мащаб
ElevenLabsДоминация в гласаПо-малко SFX фокус
Kling AI (Kuaishou)Интегрирана видео платформаПо-малка аудио специализация

Sony, Tencent и ElevenLabs всички играят в съседни пространства. Но лазерният фокус на Mirelo върху звукови ефекти за видео им дава предимство. Не се опитват да бъдат всичко—опитват се да бъдат отлични в едно нещо.

Етиката на тренировъчните данни

Един детайл ми направи впечатление: Mirelo получава тренировъчни данни от публични и закупени звукови библиотеки, с партньорства за споделяне на приходи, които зачитат правата на артистите.

Това има значение. AI индустрията е под нарастващ контрол относно практиките с тренировъчни данни. Mirelo изглежда гради етично от основите, което може да стане конкурентно предимство, докато регулациите се затягат.

Какво означава това за творците

Ако генерирате AI видео днес, работният ви процес вероятно изглежда така:

  1. Генериране на визии със Sora/Runway/Veo
  2. Експорт в софтуер за редакция
  3. Ръчно добавяне на звукови ефекти от библиотека
  4. Синхронизиране на аудио с видео
  5. Регулиране на нива и тайминг
  6. Експорт на финалното видео

С Mirelo стъпки 3-5 се свиват в едно API извикване. Спестяването на време се увеличава бързо, когато произвеждате в обем.

Пътят към AI музика

Mirelo има AI генериране на музика в пътната си карта. Моделът за звукови ефекти е само началото.

Представете си генериране на видео с:

  • AI-генерирани визии
  • AI-генериран диалог (ElevenLabs)
  • AI-генерирани звукови ефекти (Mirelo)
  • AI-генериран саундтрак (бъдещ Mirelo)

Събираме парчетата за напълно синтетични медии. Дали това ви вълнува или ви плаши вероятно зависи от това какво създавате за препитание.

Цени и достъп

За творци, които искат да опитат Mirelo:

  • Безплатно ниво: Ограничени генерирания за тестване на платформата
  • Creator план: €20/месец (~$23.50) за препоръчително използване
  • API: Плащане за използване чрез Fal.ai и Replicate
  • Enterprise: Персонализирани цени за мащаб

Creator планът е изненадващо достъпен предвид технологията. Сравнете това с наемането на foley артист или лицензиране на професионални звукови библиотеки.

Моето мнение

Толкова се фокусирахме върху това да направим AI видеото да изглежда по-добре, че забравихме, че видеото е мултисензорна среда. Mirelo коригира този пропуск.

💡

Опитайте да качите едно от вашите AI-генерирани видеа в платформата на Mirelo. Разликата между преди и след е разликата между демо и доставяемо.

Финансирането от $41 милиона предполага, че инвеститорите виждат същата възможност. Аудиото не е желана функция—то е половината от това, което прави видеото завладяващо.

Ерата на нямото кино приключи през 1927 с The Jazz Singer. Почти век по-късно AI видеото има своя собствен "talkies" момент.

Mirelo залага, че могат да бъдат звукът на тази нова ера. Базирано на технологията, екипа и времето им, този залог изглежда все по-умен.

Как да започнете

  1. Посетете mirelo.io, за да разгледате платформата
  2. Качете безмълвно AI видео
  3. Оставете Mirelo да генерира синхронизирано аудио
  4. Сравнете с вашата ръчна аудио работа
  5. Решете дали автоматизацията е готова за вашия работен процес

Бариерата за вход е ниска. Потенциалното спестяване на време е високо. И технологията само ще се подобрява, докато тези $41 милиона се разгръщат.

Звукът най-накрая има място на масата на AI видеото.

Беше ли полезна тази статия?

Henry

Henry

Творчески технолог

Творчески технолог от Лозана, който изследва къде изкуственият интелект среща изкуството. Експериментира с генеративни модели между сесии по електронна музика.

Свързани статии

Продължете да изследвате със свързаните публикации

Хареса ли Ви тази статия?

Открийте още полезна информация и следете най-новото ни съдържание.

Mirelo набра $41M, за да реши проблема с тишината в AI видеата