Meta Pixel
HenryHenry
6 min read
1009 szó

Mirelo 41 millió dollárt gyűjtött az AI videók néma problémájának megoldására

A berlini startup, a Mirelo 41 millió dollárt szerzett az Index Ventures-től és az a16z-től, hogy AI-generált hangeffektusokat vigyen a videókba. A Mistral és Hugging Face vezetőinek támogatásával azt építik, amire az iparágnak égető szüksége van: intelligens hangot a néma videó forradalomhoz.

Mirelo 41 millió dollárt gyűjtött az AI videók néma problémájának megoldására

Minden alkalommal, amikor AI videót generálok, ugyanaz történik. A látványtól leesik az állam. A mozgás folyékony. A világítás filmes. Aztán megnyomom a lejátszást és... semmi. Csend. A némafilm korszakában éltünk, és nem is vettem észre eddig.

A 41 milliós fogadás a hangra

A Mirelo, egy berlini startup, amelyet AI kutatók alapítottak, akik történetesen zenészek is, éppen most zárta le 41 millió dolláros seed körét. Az Index Ventures és az Andreessen Horowitz vezette a befektetést. Ez nem kis tét a hangra.

💡

A Mirelo teljes finanszírozása most 44 millió dollár, beleértve a korábbi pre-seed támogatást az Atlantic-tól. Az angyal befektetők listája úgy olvasható, mint egy AI hírességek csarnoka: Arthur Mensch (Mistral CEO), Thomas Wolf (Hugging Face tudományos vezető), és Burkay Gur (Fal.ai társalapító).

Az ötlet elegáns: feltöltesz egy videót, az AI-juk megnézi, és tökéletesen szinkronizált hangeffektusokat generál. Nem általános háttérzenét. Valódi foley-stílusú hangot, amely megfelel annak, ami a képernyőn történik.

Miért számít ez most

Gondoljunk az AI videó környezetre 2025 decemberében:

  • A Runway Gen-4.5 lenyűgöző látványt produkál, de nincs natív hangja
  • A Sora 2 akár 90 másodperces klipeket generál—mind néma
  • A Veo 3.1 éppen most adott hozzá hangot, de csak bizonyos funkciókhoz

Az iparág fotorealisztikus generálás felé sprintelt, miközben az érzékszervi élmény felét hátrahagyta. A Mirelo tölti be ezt az űrt.

$41M
Seed kör
2-3x
Csapat növekedési cél
€20/hó
Creator csomag

Hogyan működik a Mirelo SFX

A zászlóshajó modelljük a Mirelo SFX v1.5. Az API dokumentációjukból és demóikból az következik:

  1. Jelenet elemzés: A modell megnézi a videót és azonosítja az objektumokat, akciókat és környezeti kontextust
  2. Időbeli térképezés: Kitalálja, mikor történnek az események—ajtó csukódás, lépések, üveg törés
  3. Hang generálás: Az AI olyan hangot hoz létre, amely megfelel a vizuális időzítésnek és akusztikus tulajdonságoknak
  4. Keverés: Minden rétegelve lesz megfelelő szintekkel és térbeli pozícionálással

Az eredmény nem csak a videóra ragasztott hangeffektusok. Olyan hang, amely úgy érzi, hogy oda tartozik.

Bemenet: AI-generált videó esőről, amely ablakra csapódik
Kimenet: Esőcseppek változó intenzitással, üveg rezonancia, környezeti szobahang
Eredmény: A videó hirtelen valóságosnak érződik

A zenész alapítók

CJ Simon-Gabriel és Florian Wenzel mindketten AI kutatók és zenészek. Ez a kombináció többet számít, mint gondolnád.

A zenészek megértenek valamit a hangról, amit a tiszta ML mérnökök talán kihagynak: az időzítés minden. Egy hangeffektus, amely 50 milliszekundummal később érkezik, rossznak érződik, még akkor is, ha tudatosan nem tudod azonosítani, miért. A hang érzelmi hatása mikroszkopikus szinkronizálástól függ.

Kettős hátterük megmutatkozik a termékben. A Mirelo nem csak hangokat generál—zeneiséggel generálja őket.

A terjesztési stratégia

A Mirelo okos megközelítést alkalmaz a piacon:

CsatornaCélStátusz
Mirelo StudioDirekt alkotói munkaterületElérhető
Fal.aiAPI fejlesztőknekÉles
ReplicateAlternatív API hozzáférésÉles
Freemium€20/hó alkotói csomagElérhető

A Fal.ai-n és Replicate-en keresztüli terjesztéssel ott találkoznak a fejlesztőkkel, ahol már építenek. Ha AI videó pipeline-t készítesz, bedobhatod a Mirelo-t a stack-edbe anélkül, hogy mindent újra kellene építeni.

A verseny közeledik

A Mirelo nem vákuumban működik:

CompanyStrengthWeakness
MireloSpecializált fókusz + zenész alapítókStartup méret
ElevenLabsHang dominanciaKevesebb SFX fókusz
Kling AI (Kuaishou)Integrált videó platformKevesebb hang specializáció

A Sony, Tencent és ElevenLabs mind szomszédos terekben játszanak. De a Mirelo lézer fókusza a videó hangeffektusaira előnyt ad nekik. Nem próbálnak mindent lenni—egy dologban próbálnak kiválóak lenni.

A tréning adatok etikája

Egy részlet kiugrott nekem: A Mirelo nyilvános és megvásárolt hangkönyvtárakból szerzi a tréning adatokat, bevétel-megosztó partnerségekkel, amelyek tiszteletben tartják a művészek jogait.

Ez számít. Az AI iparág egyre nagyobb vizsgálat alatt áll a tréning adat gyakorlatok miatt. A Mirelo úgy tűnik, etikusan épít az alapoktól, ami versenyelőnnyé válhat, ahogy a szabályozások szigorodnak.

Mit jelent ez az alkotóknak

Ha ma AI videót generálsz, a munkafolyamatod valószínűleg így néz ki:

  1. Vizuális generálása Sora/Runway/Veo-val
  2. Exportálás szerkesztő szoftverbe
  3. Hangeffektusok manuális hozzáadása könyvtárból
  4. Hang szinkronizálása videóhoz
  5. Szintek és időzítés beállítása
  6. Végső videó exportálása

A Mirelo-val a 3-5. lépések egyetlen API hívásba összecsukódnak. Az időmegtakarítás gyorsan összesedik, amikor nagy mennyiséget gyártasz.

Az út az AI zenéhez

A Mirelo ütemtervében AI zenegenerálás van. A hangeffektus modell csak a kezdet.

Képzeld el egy videó generálását:

  • AI-generált vizuálissal
  • AI-generált párbeszéddel (ElevenLabs)
  • AI-generált hangeffektusokkal (Mirelo)
  • AI-generált soundtrackkel (jövőbeli Mirelo)

A teljesen szintetikus média darabjait állítjuk össze. Hogy ez izgat vagy rémít, valószínűleg attól függ, mit alkotsz megélhetésért.

Árazás és hozzáférés

Alkotóknak, akik ki akarják próbálni a Mirelo-t:

  • Ingyenes szint: Korlátozott generálások a platform teszteléséhez
  • Alkotói csomag: €20/hó (~$23.50) ajánlott használatra
  • API: Használat alapú fizetés Fal.ai-n és Replicate-en keresztül
  • Enterprise: Egyedi árazás nagy méretekhez

Az alkotói csomag meglepően megfizethető a technológiát tekintve. Hasonlítsd össze egy foley művész bérlésével vagy professzionális hangkönyvtárak licencelésével.

Véleményem

Annyira a látványra koncentráltunk, hogy elfelejtettük, a videó többérzékszervi médium. A Mirelo ezt az elmulasztást korrigálja.

💡

Próbálj meg feltölteni egy AI-generált videódat a Mirelo platformjára. A különbség az előtte és utána között a különbség a demó és a szállítható között.

A 41 millió dolláros finanszírozás azt sugallja, a befektetők ugyanazt a lehetőséget látják. A hang nem opcionális funkció—a videó vonzerejének fele.

A némafilm korszak 1927-ben ért véget a The Jazz Singer-rel. Majdnem egy évszázaddal később az AI videónak saját "hangosfilm" pillanata van.

A Mirelo arra tesz, hogy ők lehetnek ennek az új korszaknak a hangja. A technológiájuk, csapatuk és időzítésük alapján ez a fogadás egyre okosabbnak tűnik.

Kezdés

  1. Látogasd meg a mirelo.io-t a platform felfedezéséhez
  2. Tölts fel egy néma AI videót
  3. Hagyd, hogy a Mirelo szinkronizált hangot generáljon
  4. Hasonlítsd össze a manuális hangi munkáddal
  5. Döntsd el, hogy az automatizálás készen áll-e a munkafolyamatodra

A belépési korlát alacsony. A potenciális időmegtakarítás magas. És a technológia csak javulni fog, ahogy azt a 41 millió dollárt telepítik.

A hang végre helyet kapott az AI videó asztalánál.

Hasznos volt ez a cikk?

Henry

Henry

Kreatív Technológus

Kreatív technológus Lausanne-ból, aki azt kutatja, hol találkozik az AI a művészettel. Generatív modellekkel kísérletezik elektronikus zenei szesszióik között.

Kapcsolódó cikkek

Fedezd fel ezeket a kapcsolódó bejegyzéseket

Tetszett a cikk?

Fedezz fel további érdekességeket, és maradj naprakész a legújabb tartalmainkkal.

Mirelo 41 millió dollárt gyűjtött az AI videók néma problémájának megoldására