Meta Pixel
HenryHenry
5 min read
986 žodžiai

Mirelo pritraukė 41 mln. dolerių AI vaizdo tylosios problemos sprendimui

Berlyno startuolis Mirelo ką tik gavo 41 mln. dolerių iš Index Ventures ir a16z, kad vaizdo įrašams sukurtų dirbtinio intelekto generuojamus garso efektus. Turint Mistral ir Hogging Face vadovų paramą, jie kuria tai, ko pramonei būtinai reikia: protingą garsą tylajai vaizdo revoliucijai.

Mirelo pritraukė 41 mln. dolerių AI vaizdo tylosios problemos sprendimui

Ready to create your own AI videos?

Join thousands of creators using Bonega.ai

Kiekvieną kartą generuodamas AI vaizdo įrašą patiriau tą patį. Vaizdai užgniaužia kvapą. Judėjimas sklandus. Apšvietimas kinematografiškas. Tada paspaudžiu paleidimą ir... niekas. Tyla. Gyvenome nebylių filmų eroje ir net neįsivaizduoju to iki šiol.

41 mln. dolerių statymas į garsą

Mirelo, Berlyne veikiantis startuolis, kurį įkūrė AI mokslininkai, kurie atsitiktinai yra ir muzikantai, ką tik uždarė 41 mln. dolerių pradinio investavimo raundą. Index Ventures ir Andreessen Horowitz vadovavo investicijai. Tai nėra mažas statymas į garsą.

💡

Mirelo bendras finansavimas dabar siekia 44 mln. dolerių, įskaitant ankstesnę ikipradinę paramą iš Atlantic. Angelų investuotojų sąrašas atrodo kaip AI šlovės salė: Arthur Mensch (Mistral vykdantysis direktorius), Thomas Wolf (Hugging Face vyriausiasis mokslo pareigūnas) ir Burkay Gur (Fal.ai bendraturčių įkūrėjas).

Idėja elegantiška: įkeli vaizdo įrašą, jų AI jį žiūri ir generuoja tobulai sinchronizuotus garso efektus. Ne bendrą fono muziką. Tikrus foley stiliaus garsus, kurie atitinka tai, kas vyksta ekrane.

Kodėl tai svarbu dabar

Pagalvok apie AI vaizdo peizažą 2025 m. gruodį:

  • Runway Gen-4.5 sukuria stulbinančius vaizds, bet be natūralaus garso
  • Sora 2 generuoja iki 90 sekundžių klipus—visi tylūs
  • Veo 3.1 ką tik pridėjo garsą, bet tik tam tikroms funkcijoms

Pramonė sprinto link fotorealistinio generavimo, palikdama pusę jutiminio patyrimo. Mirelo užpildo šią spragą.

41 mln. $
Pradinio etapo raundas
2-3x
Komandos augimo tikslas
20 €/mėn.
Kūrėjo planas

Kaip veikia Mirelo SFX

Jų pagrindinis modelis vadinasi Mirelo SFX v1.5. Iš jų API dokumentacijos ir demonstracijų galiu susidėlioti:

  1. Scenos analizė: Modelis žiūri tavo vaizdo įrašą ir identifikuoja objektus, veiksmus ir aplinkos kontekstą
  2. Laikinis kartografavimas: Jis išsiaiškina, kada įvyksta įvykiai—durys užsidaro, žingsniai, stiklas sudūžta
  3. Garso generavimas: AI sukuria garsą, kuris atitinka vaizdinį laiką ir akustinius ypatumus
  4. Maišymas: Viskas sluoksniuojama kartu su atitinkamais lygiais ir erdviniu išdėstymu

Rezultatas nėra tik garso efektai, užklijuoti ant vaizdo įrašo. Tai garsas, kuris atrodo, kad ten priklauso.

Įvestis: AI generuotas vaizdo įrašas apie lietų, krentantį į langą
Išvestis: Lietaus lašai su įvairiuojančiu intensyvumu, stiklo rezonansas, aplinkos kambario tonas
Rezultatas: Vaizdo įrašas staiga tampa tikras

Muzikantai įkūrėjai

CJ Simon-Gabriel ir Florian Wenzel abu yra AI mokslininkai ir muzikantai. Šis derinys svarbesnis, nei galėtum manyti.

Muzikantai supranta kažką apie garsą, ko gryni ML inžinieriai gali praleisti: laikas yra viskas. Garso efektas, kuris ateina 50 milisekundžių vėliau, jaučiasi neteisingai, net jei negali sąmoningai nustatyti kodėl. Garso emocinis poveikis priklauso nuo mikroskopiškos sinchronizacijos.

Jų dviguba patirtis matoma produkte. Mirelo ne tik generuoja garsus—jis generuoja juos su muzikalumu.

Platinimo strategija

Mirelo ima gudrus požiūris į rinką:

KanalasTikslasBūsena
Mirelo StudioTiesioginė kūrėjų darbo erdvėPrieinamas
Fal.aiAPI kūrėjamsVeikia
ReplicateAlternatyvus API priėjimasVeikia
Freemium20 €/mėn. kūrėjo planasPrieinamas

Platindami per Fal.ai ir Replicate, jie sutinka kūrėjus ten, kur jie jau kuria. Jei kurti AI vaizdo konvejerį, gali įdėti Mirelo į savo sistemą neperstačius visko.

Konkurencija artėja

Mirelo neveikia vakuume:

CompanyStrengthWeakness
MireloSpecializuotas dėmesys + muzikantai įkūrėjaiStartuolio mastas
ElevenLabsBalso dominavimasMažiau SFX dėmesio
Kling AI (Kuaishou)Integruota vaizdo platformaMažiau garso specializacijos

Sony, Tencent ir ElevenLabs visi žaidžia gretimose erdvėse. Bet Mirelo lazerio dėmesys garso efektams vaizdo įrašuose suteikia jiems pranašumą. Jie nebando būti viskas—jie bando būti puikūs viename dalyke.

Mokymo duomenų etika

Viena detalė man pasirodė: Mirelo gauna mokymo duomenis iš viešų ir pirktų garso bibliotekų, su pajamų dalijimosi partnerystėmis, kurios gerbia menininkų teises.

Tai svarbu. AI pramonė susiduria su augančia priežiūra dėl mokymo duomenų praktikos. Mirelo atrodo stato etiškai nuo pat pradžių, kas gali tapti konkurenciniu pranašumu, kai reguliavimai sugriežtės.

Ką tai reiškia kūrėjams

Jei šiandien generuoji AI vaizdo įrašą, tavo darbo eiga greičiausiai atrodo taip:

  1. Generuok vaizus su Sora/Runway/Veo
  2. Eksportuok į redagavimo programinę įrangą
  3. Rankiniu būdu pridėk garso efektus iš bibliotekos
  4. Sinchronizuok garsą su vaizdo įrašu
  5. Sureguliuok lygius ir laiką
  6. Eksportuok galutinį vaizdo įrašą

Su Mirelo, žingsniai 3-5 susitraukia į vieną API kvietimą. Laiko sutaupymas greitai dauginasi, kai gamini kiekį.

Kelias į AI muziką

Mirelo kelių žemėlapyje yra AI muzikos generavimas. Garso efektų modelis yra tik pradžia.

Įsivaizduok vaizdo įrašo generavimą su:

  • AI generuotais vaizdais
  • AI generuotu dialogu (ElevenLabs)
  • AI generuotais garso efektais (Mirelo)
  • AI generuotu garso takeliu (būsimas Mirelo)

Mes surenkami gabalus visiškai sintetinei medijai. Ar tai tave džiugina ar gąsdina, tikriausiai priklauso nuo to, ką kurti pragyvenimui.

Kainodara ir prieiga

Kūrėjams, norintiems išbandyti Mirelo:

  • Nemokamas lygis: Ribotas generavimas platformos išbandymui
  • Kūrėjo planas: 20 €/mėn. (~23,50 $) rekomenduojamam naudojimui
  • API: Mokėk už naudojimą per Fal.ai ir Replicate
  • Įmonė: Pritaikyta kainodara masiui

Kūrėjo planas stebėtinai prieinamas, atsižvelgiant į technologiją. Palygink tai su foley menininko samdymu ar profesionalių garso bibliotekų licencijavimu.

Mano nuomonė

Buvome taip sutelkti į AI vaizdo gerinimą, kad pamiršome, jog vaizdo įrašas yra daugiajutė medija. Mirelo taiso šią stokojimą.

💡

Išbandyk įkelti vieną savo AI generuotų vaizdo įrašų į Mirelo platformą. Skirtumas tarp prieš ir po yra skirtumas tarp demo ir pristatomo.

41 mln. dolerių finansavimas rodo, kad investuotojai mato tą pačią galimybę. Garsas nėra gražus papildomas bruožas—tai pusė to, kas daro vaizdo įrašą patrauklų.

Nebylių filmų era baigėsi 1927 m. su The Jazz Singer. Beveik amžių vėliau AI vaizdo įrašas patiria savo "garsių" momentą.

Mirelo stato, kad jie gali būti šios naujos eros garsas. Remiantis jų technologija, komanda ir laiku, tas statymas atrodo vis protingesnis.

Pradžia

  1. Apsilankyk mirelo.io, kad ištirtum platformą
  2. Įkelk tylų AI vaizdo įrašą
  3. Leisk Mirelo generuoti sinchronizuotą garsą
  4. Palygink su savo rankiniu garso darbu
  5. Nuspręsk, ar automatizavimas paruoštas tavo darbo eigai

Įėjimo barjeras žemas. Potencialus laiko sutaupymas didelis. Ir technologija tik gerės, kai tie 41 mln. dolerių bus panaudoti.

Garsas galiausiai turi vietą prie AI vaizdo stalo.

Ar šis straipsnis buvo naudingas?

Henry

Henry

Kūrybinis technologas

Kūrybinis technologas iš Lozanos, tyrinėjantis, kur DI susitinka su menu. Eksperimentuoja su generatyviniais modeliais tarp elektroninės muzikos sesijų.

Like what you read?

Turn your ideas into unlimited-length AI videos in minutes.

Susiję straipsniai

Tęskite tyrinėjimą su šiais susijusiais straipsniais

Ar jums patiko šis straipsnis?

Atraskite daugiau įžvalgų ir sekite mūsų naujausią turinį.

Mirelo pritraukė 41 mln. dolerių AI vaizdo tylosios problemos sprendimui