Mirelo сабрала $41M для вырашэння праблемы маўклівага AI відэа
Берлінскі стартап Mirelo толькі што атрымаў $41 мільён ад Index Ventures і a16z, каб прынесці AI-генераваныя гукавыя эфекты ў відэа. З падтрымкай кіраўнікоў Mistral і Hugging Face яны ствараюць тое, што так адчайна патрэбна індустрыі: разумнае аўдыё для маўклівай відэа-рэвалюцыі.

Кожны раз, калі я генеруя AI відэа, адбываецца тое ж самае. Візуалы захапляюць дух. Рух плаўны. Асвятленне кінематаграфічнае. Потым я націскаю прайграванне і... нічога. Цішыня. Мы жывём у эпоху нямога кіно, і я нават не здаваў сабе справу да гэтага моманту.
Стаўка ў $41 мільён на гук
Mirelo, стартап з Берліна, заснаваны даследчыкамі AI, якія з'яўляюцца музыкантамі, толькі што закрыў seed раўнд на $41 мільён. Інвестыцыю ўзначалілі Index Ventures і Andreessen Horowitz. Гэта не малая стаўка на аўдыё.
Агульны фінансаванне Mirelo цяпер складае $44 мільёны, уключаючы папярэднюю pre-seed падтрымку ад Atlantic. Спіс анёльскіх інвестараў выглядае як зала славы AI: Arthur Mensch (генеральны дырэктар Mistral), Thomas Wolf (галоўны навуковы супрацоўнік Hugging Face) і Burkay Gur (саснавальнік Fal.ai).
Прапанова элегантная: вы загружаеце відэа, іх AI назірае за ім і генеруе ідэальна сінхранізаваныя гукавыя эфекты. Не агульная фонавая музыка. Сапраўдныя аўдыё ў стылі foley, якія адпавядаюць таму, што адбываецца на экране.
Чаму гэта важна зараз
Падумайце пра ландшафт AI відэа ў снежні 2025:
- Runway Gen-4.5 стварае цудоўную візуалізацыю, але без роднага аўдыё
- Sora 2 генеруе кліпы працягласцю да 90 секунд—усе маўклівыя
- Veo 3.1 толькі што дадала аўдыё, але толькі для пэўных функцый
Індустрыя імчыцца да фотарэалістычнай генерацыі, пакідаючы за сабой палову сенсарнага досведу. Mirelo запаўняе гэты прабел.
Як працуе Mirelo SFX
Іх флагманская мадэль называецца Mirelo SFX v1.5. З таго, што я магу скласці з іх API дакументацыі і дэма:
- Аналіз сцэны: Мадэль назірае за вашым відэа і вызначае аб'екты, дзеянні і кантэкст асяроддзя
- Часавае адлюстраванне: Яна вызначае, калі адбываюцца падзеі—зачыненне дзвярэй, крокі, разбітае шкло
- Генерацыя гуку: AI стварае аўдыё, якое адпавядае візуальнай сінхранізацыі і акустычным уласцівасцям
- Змешванне: Усё склейваецца разам з адпаведнымі ўзроўнямі і прасторавым размяшчэннем
Вынік не проста гукавыя эфекты, накладзеныя на відэа. Гэта аўдыё, якое адчуваецца натуральна.
Увод: AI-генераванае відэа дажджу, які б'е па акне
Вывад: Кроплі дажджу з рознай інтэнсіўнасцю, рэзананс шкла, навакольны тон памяшкання
Вынік: Відэа раптам адчуваецца рэальнымМузыканты-заснавальнікі
CJ Simon-Gabriel і Florian Wenzel абодва з'яўляюцца даследчыкамі AI і музыкантамі. Гэта спалучэнне важнейшае, чым вы можаце падумаць.
Музыканты разумеюць нешта пра аўдыё, што чыстыя ML інжынеры могуць прапусціць: таймінг—гэта ўсё. Гукавы эфект, які прыходзіць на 50 мілісекунд позна, адчуваецца няправільна, нават калі вы не можаце свядома вызначыць чаму. Эмацыйны ўплыў аўдыё залежыць ад мікраскапічнай сінхранізацыі.
Іх падвойнае паходжанне відаць у прадукце. Mirelo не проста генеруе гукі—яна генеруе іх з музыкальнасцю.
Стратэгія дыстрыбуцыі
Mirelo выкарыстоўвае разумны падыход да рынку:
| Канал | Мэта | Статус |
|---|---|---|
| Mirelo Studio | Прамы рабочы прастора для стваральнікаў | Даступны |
| Fal.ai | API для распрацоўшчыкаў | Працуе |
| Replicate | Альтэрнатыўны доступ да API | Працуе |
| Freemium | План для стваральнікаў €20/месяц | Даступны |
Дыстрыбуюючы праз Fal.ai і Replicate, яны сустракаюць распрацоўшчыкаў там, дзе тыя ўжо будуюць. Калі вы ствараеце канвеер AI відэа, вы можаце ўключыць Mirelo ў свой стэк без перабудовы ўсяго.
Канкурэнцыя набліжаецца
Mirelo не працуе ва ўмовах вакууму:
| Кампанія | Сіла | Слабасць |
|---|---|---|
| Mirelo | Спецыялізаваная канцэнтрацыя + Музыканты-заснавальнікі | Маштаб стартапа |
| ElevenLabs | Дамінаванне ў галасе | Менш фокусу на SFX |
| Kling AI (Kuaishou) | Інтэграваная відэа-платформа | Менш аўдыё спецыялізацыі |
Sony, Tencent і ElevenLabs усе гуляюць у сумежных прасторах. Але лазернае фокусаванне Mirelo на гукавых эфектах для відэа дае ім перавагу. Яны не спрабуюць быць усім—яны спрабуюць быць выдатнымі ў адной справе.
Этыка навучальных даных
Адна дэталь выдзялялася для мяне: Mirelo атрымлівае навучальныя дадзеныя з публічных і набытых гукавых бібліятэк, з партнёрствамі па падзеле даходу, якія паважаюць правы артыстаў.
Гэта важна. AI індустрыя сутыкаецца з узмацненнем правяркі практыкі навучальных даных. Mirelo, здаецца, будуе этычна з самага пачатку, што можа стаць канкурэнтнай перавагай па меры ўзмацнення рэгулявання.
Што гэта азначае для стваральнікаў
Калі вы сёння генеруеце AI відэа, ваш рабочы працэс верагодна выглядае так:
- Генерацыя візуалаў з Sora/Runway/Veo
- Экспарт у рэдактарскае праграмнае забеспячэнне
- Ручное дабаўленне гукавых эфектаў з бібліятэкі
- Сінхранізацыя аўдыё з відэа
- Рэгуляванне ўзроўняў і таймінгу
- Экспарт канчатковага відэа
З Mirelo крокі 3-5 згортваюцца ў адзін выклік API. Эканомія часу хутка кампануецца, калі вы вырабляеце аб'ём.
Шлях да AI музыкі
Mirelo мае генерацыю AI музыкі ў сваёй дарожнай карце. Мадэль гукавых эфектаў—гэта толькі пачатак.
Уявіце генерацыю відэа з:
- AI-генераванай візуалізацыяй
- AI-генераваным дыялогам (ElevenLabs)
- AI-генераванымі гукавымі эфектамі (Mirelo)
- AI-генераванай гукавой дарожкай (будучая Mirelo)
Мы збіраем кавалкі для цалкам сінтэтычных медыя. Узрушае гэта вас ці пужае, верагодна, залежыць ад таго, што вы ствараеце для жыцця.
Цэны і доступ
Для стваральнікаў, якія хочуць паспрабаваць Mirelo:
- Бясплатны ўзровень: Абмежаваная генерацыя для тэставання платформы
- План для стваральнікаў: €20/месяц (~$23.50) для рэкамендаванага выкарыстання
- API: Аплата па выкарыстанні праз Fal.ai і Replicate
- Карпаратыўны: Індывідуальныя цэны для маштабу
План для стваральнікаў здзіўляюча даступны, улічваючы тэхналогію. Параўнайце гэта з найманнем foley-мастака ці ліцэнзаваннем прафесійных гукавых бібліятэк.
Мой погляд
Мы настолькі засяродзіліся на паляпшэнні выгляду AI відэа, што забыліся, што відэа—гэта шматсенсарная прастора. Mirelo выпраўляе гэты недагляд.
Паспрабуйце загрузіць адно з вашых AI-генераваных відэа на платформу Mirelo. Розніца паміж да і пасля—гэта розніца паміж дэма і гатовым прадуктам.
$41 мільён фінансавання сведчыць аб тым, што інвестары бачаць тую ж магчымасць. Аўдыё—не прыемная дадатковая функцыя—гэта палова таго, што робіць відэа прывабным.
Эпоха нямога кіно скончылася ў 1927 годзе з The Jazz Singer. Амаль праз стагоддзе AI відэа пераживае свой уласны момант "гукавога кіно".
Mirelo робіць стаўку, што яны могуць стаць гукам гэтай новай эры. На падставе іх тэхналогіі, каманды і таймінгу гэтая стаўка выглядае ўсё больш разумнай.
Пачатак работы
- Наведайце mirelo.io, каб даследаваць платформу
- Загрузіце маўклівае AI відэа
- Дазвольце Mirelo генераваць сінхранізаванае аўдыё
- Параўнайце з вашай ручной аўдыё працай
- Вырашыце, ці гатовая аўтаматызацыя для вашага працоўнага працэсу
Бар'ер для ўваходу нізкі. Патэнцыйная эканомія часу высокая. І тэхналогія толькі будзе паляпшацца па меры разгортвання тых $41 мільёнаў.
Гук нарэшце атрымаў месца за сталом AI відэа.
Гэты артыкул быў карысны?

Henry
Творчы тэхнолагТворчы тэхнолаг з Лазаны, які даследуе сутыкненне ШІ і мастацтва. Эксперыментуе з генератыўнымі мадэлямі паміж сеансамі электроннай музыкі.
Звязаныя артыкулы
Працягвайце даследаванне з гэтымі звязанымі допісамі

Pika 2.5: Даступнае AI-відэа праз хуткасць, кошт і інструменты
Pika Labs выпускае версію 2.5 з хуткай генерацыяй, паляпшанай фізікай і інструментамі як Pikaframes і Pikaffects для працы з відэа.
Google Заходзіць у гонку ШІ-аватараў: Veo 3.1 супільнамоцьвае новыя аватары ў Google Vids
Google абнавіла ШІ-аватары ў Vids з дапамогай Veo 3.1, абяцаючы карыстальнікам прадпрыемства пяцікратнае перавагу над конкурентамі. Як гэта адносіцца да Synthesia і HeyGen?

Поўны даведнік па інжынірынгу промтаў для ШІ-відэа ў 2025 годзе
Авалодайце майстэрствам стварэння промтаў, якія ствараюць выдатныя ШІ-генерыраваныя відэа. Вывучыце шасцішаровую сістэму, кінематаграфічную тэрміналогію і тэхнікі для розных платформаў.