Mirelo 41 millió dollárt gyűjtött az AI videók néma problémájának megoldására
A berlini startup, a Mirelo 41 millió dollárt szerzett az Index Ventures-től és az a16z-től, hogy AI-generált hangeffektusokat vigyen a videókba. A Mistral és Hugging Face vezetőinek támogatásával azt építik, amire az iparágnak égető szüksége van: intelligens hangot a néma videó forradalomhoz.

Minden alkalommal, amikor AI videót generálok, ugyanaz történik. A látványtól leesik az állam. A mozgás folyékony. A világítás filmes. Aztán megnyomom a lejátszást és... semmi. Csend. A némafilm korszakában éltünk, és nem is vettem észre eddig.
A 41 milliós fogadás a hangra
A Mirelo, egy berlini startup, amelyet AI kutatók alapítottak, akik történetesen zenészek is, éppen most zárta le 41 millió dolláros seed körét. Az Index Ventures és az Andreessen Horowitz vezette a befektetést. Ez nem kis tét a hangra.
A Mirelo teljes finanszírozása most 44 millió dollár, beleértve a korábbi pre-seed támogatást az Atlantic-tól. Az angyal befektetők listája úgy olvasható, mint egy AI hírességek csarnoka: Arthur Mensch (Mistral CEO), Thomas Wolf (Hugging Face tudományos vezető), és Burkay Gur (Fal.ai társalapító).
Az ötlet elegáns: feltöltesz egy videót, az AI-juk megnézi, és tökéletesen szinkronizált hangeffektusokat generál. Nem általános háttérzenét. Valódi foley-stílusú hangot, amely megfelel annak, ami a képernyőn történik.
Miért számít ez most
Gondoljunk az AI videó környezetre 2025 decemberében:
- A Runway Gen-4.5 lenyűgöző látványt produkál, de nincs natív hangja
- A Sora 2 akár 90 másodperces klipeket generál—mind néma
- A Veo 3.1 éppen most adott hozzá hangot, de csak bizonyos funkciókhoz
Az iparág fotorealisztikus generálás felé sprintelt, miközben az érzékszervi élmény felét hátrahagyta. A Mirelo tölti be ezt az űrt.
Hogyan működik a Mirelo SFX
A zászlóshajó modelljük a Mirelo SFX v1.5. Az API dokumentációjukból és demóikból az következik:
- Jelenet elemzés: A modell megnézi a videót és azonosítja az objektumokat, akciókat és környezeti kontextust
- Időbeli térképezés: Kitalálja, mikor történnek az események—ajtó csukódás, lépések, üveg törés
- Hang generálás: Az AI olyan hangot hoz létre, amely megfelel a vizuális időzítésnek és akusztikus tulajdonságoknak
- Keverés: Minden rétegelve lesz megfelelő szintekkel és térbeli pozícionálással
Az eredmény nem csak a videóra ragasztott hangeffektusok. Olyan hang, amely úgy érzi, hogy oda tartozik.
Bemenet: AI-generált videó esőről, amely ablakra csapódik
Kimenet: Esőcseppek változó intenzitással, üveg rezonancia, környezeti szobahang
Eredmény: A videó hirtelen valóságosnak érződikA zenész alapítók
CJ Simon-Gabriel és Florian Wenzel mindketten AI kutatók és zenészek. Ez a kombináció többet számít, mint gondolnád.
A zenészek megértenek valamit a hangról, amit a tiszta ML mérnökök talán kihagynak: az időzítés minden. Egy hangeffektus, amely 50 milliszekundummal később érkezik, rossznak érződik, még akkor is, ha tudatosan nem tudod azonosítani, miért. A hang érzelmi hatása mikroszkopikus szinkronizálástól függ.
Kettős hátterük megmutatkozik a termékben. A Mirelo nem csak hangokat generál—zeneiséggel generálja őket.
A terjesztési stratégia
A Mirelo okos megközelítést alkalmaz a piacon:
| Csatorna | Cél | Státusz |
|---|---|---|
| Mirelo Studio | Direkt alkotói munkaterület | Elérhető |
| Fal.ai | API fejlesztőknek | Éles |
| Replicate | Alternatív API hozzáférés | Éles |
| Freemium | €20/hó alkotói csomag | Elérhető |
A Fal.ai-n és Replicate-en keresztüli terjesztéssel ott találkoznak a fejlesztőkkel, ahol már építenek. Ha AI videó pipeline-t készítesz, bedobhatod a Mirelo-t a stack-edbe anélkül, hogy mindent újra kellene építeni.
A verseny közeledik
A Mirelo nem vákuumban működik:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Specializált fókusz + zenész alapítók | Startup méret |
| ElevenLabs | Hang dominancia | Kevesebb SFX fókusz |
| Kling AI (Kuaishou) | Integrált videó platform | Kevesebb hang specializáció |
A Sony, Tencent és ElevenLabs mind szomszédos terekben játszanak. De a Mirelo lézer fókusza a videó hangeffektusaira előnyt ad nekik. Nem próbálnak mindent lenni—egy dologban próbálnak kiválóak lenni.
A tréning adatok etikája
Egy részlet kiugrott nekem: A Mirelo nyilvános és megvásárolt hangkönyvtárakból szerzi a tréning adatokat, bevétel-megosztó partnerségekkel, amelyek tiszteletben tartják a művészek jogait.
Ez számít. Az AI iparág egyre nagyobb vizsgálat alatt áll a tréning adat gyakorlatok miatt. A Mirelo úgy tűnik, etikusan épít az alapoktól, ami versenyelőnnyé válhat, ahogy a szabályozások szigorodnak.
Mit jelent ez az alkotóknak
Ha ma AI videót generálsz, a munkafolyamatod valószínűleg így néz ki:
- Vizuális generálása Sora/Runway/Veo-val
- Exportálás szerkesztő szoftverbe
- Hangeffektusok manuális hozzáadása könyvtárból
- Hang szinkronizálása videóhoz
- Szintek és időzítés beállítása
- Végső videó exportálása
A Mirelo-val a 3-5. lépések egyetlen API hívásba összecsukódnak. Az időmegtakarítás gyorsan összesedik, amikor nagy mennyiséget gyártasz.
Az út az AI zenéhez
A Mirelo ütemtervében AI zenegenerálás van. A hangeffektus modell csak a kezdet.
Képzeld el egy videó generálását:
- AI-generált vizuálissal
- AI-generált párbeszéddel (ElevenLabs)
- AI-generált hangeffektusokkal (Mirelo)
- AI-generált soundtrackkel (jövőbeli Mirelo)
A teljesen szintetikus média darabjait állítjuk össze. Hogy ez izgat vagy rémít, valószínűleg attól függ, mit alkotsz megélhetésért.
Árazás és hozzáférés
Alkotóknak, akik ki akarják próbálni a Mirelo-t:
- Ingyenes szint: Korlátozott generálások a platform teszteléséhez
- Alkotói csomag: €20/hó (~$23.50) ajánlott használatra
- API: Használat alapú fizetés Fal.ai-n és Replicate-en keresztül
- Enterprise: Egyedi árazás nagy méretekhez
Az alkotói csomag meglepően megfizethető a technológiát tekintve. Hasonlítsd össze egy foley művész bérlésével vagy professzionális hangkönyvtárak licencelésével.
Véleményem
Annyira a látványra koncentráltunk, hogy elfelejtettük, a videó többérzékszervi médium. A Mirelo ezt az elmulasztást korrigálja.
Próbálj meg feltölteni egy AI-generált videódat a Mirelo platformjára. A különbség az előtte és utána között a különbség a demó és a szállítható között.
A 41 millió dolláros finanszírozás azt sugallja, a befektetők ugyanazt a lehetőséget látják. A hang nem opcionális funkció—a videó vonzerejének fele.
A némafilm korszak 1927-ben ért véget a The Jazz Singer-rel. Majdnem egy évszázaddal később az AI videónak saját "hangosfilm" pillanata van.
A Mirelo arra tesz, hogy ők lehetnek ennek az új korszaknak a hangja. A technológiájuk, csapatuk és időzítésük alapján ez a fogadás egyre okosabbnak tűnik.
Kezdés
- Látogasd meg a mirelo.io-t a platform felfedezéséhez
- Tölts fel egy néma AI videót
- Hagyd, hogy a Mirelo szinkronizált hangot generáljon
- Hasonlítsd össze a manuális hangi munkáddal
- Döntsd el, hogy az automatizálás készen áll-e a munkafolyamatodra
A belépési korlát alacsony. A potenciális időmegtakarítás magas. És a technológia csak javulni fog, ahogy azt a 41 millió dollárt telepítik.
A hang végre helyet kapott az AI videó asztalánál.
Hasznos volt ez a cikk?

Henry
Kreatív TechnológusKreatív technológus Lausanne-ból, aki azt kutatja, hol találkozik az AI a művészettel. Generatív modellekkel kísérletezik elektronikus zenei szesszióik között.
Kapcsolódó cikkek
Fedezd fel ezeket a kapcsolódó bejegyzéseket

Pika 2.5: Az AI videó demokratizálása sebesség, ár és kreatív eszközök révén
A Pika Labs kiadja a 2.5-ös verziót, amely gyorsabb generálást, fejlett fizikát és kreatív eszközöket, például Pikaframes-t és Pikaffects-t kombinál, hogy az AI videót mindenki számára elérhetővé tegye.
Google belép az AI Avatar versengésbe: Veo 3.1 hajtotta avatárok a Google Vidsben
A Google frissítette a Google Vidsben az AI avatárokat Veo 3.1 modellel, azt ígérve, hogy a felhasználók ötször jobban preferálják az ezeket az avatárokat a konkurenseknél. Hogy áll ez a Synthesia és HeyGen versenytásához képest?

Teljes útmutató az AI videó prompt engineering-hez 2025-ben
Sajátítsd el a lenyűgöző AI-generált videókat létrehozó promptok tervezésének művészetét. Ismerd meg a hatszintű keretrendszert, a filmművészeti terminológiát és a platformspecifikus technikákat.