Mirelo obține 41 milioane $ pentru a rezolva problema tăcerii în videourile AI
Startup-ul berlinez Mirelo tocmai a obținut 41 de milioane de dolari de la Index Ventures și a16z pentru a aduce efecte sonore generate de AI în video. Cu sprijinul directorilor de la Mistral și Hugging Face, construiesc ceea ce industria are nevoie disperată: audio inteligent pentru revoluția video tăcută.

De fiecare dată când generez un video AI, se întâmplă același lucru. Imaginile mă uimesc. Mișcarea e fluidă. Lumina e cinematografică. Apoi apăs play și... nimic. Tăcere. Am trăit într-o eră a filmului mut și nici măcar nu am realizat până acum.
Pariul de 41 milioane pe sunet
Mirelo, un startup berlinez fondat de cercetători AI care se întâmplă să fie și muzicieni, tocmai a încheiat o rundă seed de 41 de milioane de dolari. Index Ventures și Andreessen Horowitz au condus investiția. Nu e un pariu mic pe audio.
Finanțarea totală a Mirelo ajunge acum la 44 de milioane de dolari, incluzând sprijinul pre-seed anterior de la Atlantic. Lista de investitori înger se citește ca o galerie de celebrități AI: Arthur Mensch (CEO Mistral), Thomas Wolf (director științific Hugging Face) și Burkay Gur (co-fondator Fal.ai).
Conceptul e elegant: încarci un video, AI-ul lor îl privește și generează efecte sonore perfect sincronizate. Nu muzică de fundal generică. Audio autentic în stil foley care se potrivește cu ceea ce se întâmplă pe ecran.
De ce contează acum
Gândește-te la peisajul video AI în decembrie 2025:
- Runway Gen-4.5 produce imagini uimitoare dar fără audio nativ
- Sora 2 generează clipuri de până la 90 de secunde—toate mute
- Veo 3.1 tocmai a adăugat audio, dar doar pentru anumite funcții
Industria a sprintat către generarea fotorealistă lăsând în urmă jumătate din experiența senzorială. Mirelo completează această lacună.
Cum funcționează Mirelo SFX
Modelul lor principal se numește Mirelo SFX v1.5. Din ce pot deduce din documentația API și demo-uri:
- Analiza scenei: Modelul privește videoul și identifică obiecte, acțiuni și context ambiental
- Cartografierea temporală: Descoperă când se întâmplă evenimentele—o ușă care se închide, pași, sticlă spartă
- Generarea sunetului: AI creează audio care se potrivește cu timpul vizual și proprietățile acustice
- Mixare: Totul este stratificat împreună cu niveluri și poziționare spațială adecvate
Rezultatul nu e doar efecte sonore lipite pe video. E audio care simte că aparține acolo.
Input: Video generat de AI cu ploaie lovind o fereastră
Output: Picături de ploaie cu intensitate variabilă, rezonanță sticlă, ton ambient cameră
Rezultat: Videoul devine brusc realFondatorii muzicieni
CJ Simon-Gabriel și Florian Wenzel sunt ambii cercetători AI și muzicieni. Această combinație contează mai mult decât ai crede.
Muzicienii înțeleg ceva despre audio pe care inginerii ML puri ar putea să-l rateze: timingul e totul. Un efect sonor care sosește cu 50 de milisecunde întârziere se simte greșit chiar dacă nu poți identifica conștient de ce. Impactul emoțional al audio-ului depinde de sincronizarea microscopică.
Fundamentul lor dual se vede în produs. Mirelo nu doar generează sunete—le generează cu muzicalitate.
Strategia de distribuție
Mirelo adoptă o abordare inteligentă pe piață:
| Canal | Scop | Status |
|---|---|---|
| Mirelo Studio | Spațiu de lucru direct pentru creatori | Disponibil |
| Fal.ai | API pentru dezvoltatori | Live |
| Replicate | Acces API alternativ | Live |
| Freemium | Plan creator €20/lună | Disponibil |
Distribuind prin Fal.ai și Replicate, întâlnesc dezvoltatorii acolo unde deja construiesc. Dacă creezi un pipeline video AI, poți integra Mirelo în stack-ul tău fără a reconstrui totul.
Vine competiția
Mirelo nu operează în vid:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Focus specializat + fondatori muzicieni | Scară startup |
| ElevenLabs | Dominație voce | Mai puțin focus SFX |
| Kling AI (Kuaishou) | Platformă video integrată | Mai puțină specializare audio |
Sony, Tencent și ElevenLabs joacă toate în spații adiacente. Dar focusul laser al Mirelo pe efecte sonore pentru video le oferă un avantaj. Nu încearcă să fie totul—încearcă să fie excelenți la un singur lucru.
Etica datelor de antrenament
Un detaliu mi-a atras atenția: Mirelo obține date de antrenament din biblioteci sonore publice și achiziționate, cu parteneriate de partajare a veniturilor care respectă drepturile artiștilor.
Asta contează. Industria AI se confruntă cu un control crescut asupra practicilor de date de antrenament. Mirelo pare să construiască etic de la bază, ceea ce ar putea deveni un avantaj competitiv pe măsură ce reglementările se înăspresc.
Ce înseamnă pentru creatori
Dacă generezi video AI astăzi, fluxul tău de lucru probabil arată astfel:
- Generează vizuale cu Sora/Runway/Veo
- Exportă în software de editare
- Adaugă manual efecte sonore din bibliotecă
- Sincronizează audio cu video
- Ajustează niveluri și timing
- Exportă videoul final
Cu Mirelo, pașii 3-5 se comprimă într-un singur apel API. Economiile de timp se adună rapid când produci în volum.
Drumul către muzica AI
Mirelo are generarea de muzică AI pe roadmap. Modelul de efecte sonore e doar începutul.
Imaginează-ți generarea unui video cu:
- Vizuale generate de AI
- Dialog generat de AI (ElevenLabs)
- Efecte sonore generate de AI (Mirelo)
- Coloană sonoră generată de AI (viitorul Mirelo)
Asamblăm piesele pentru media complet sintetică. Dacă asta te entuziasmează sau te înspăimântă depinde probabil de ce creezi pentru a trăi.
Prețuri și acces
Pentru creatorii care vor să încerce Mirelo:
- Nivel gratuit: Generări limitate pentru a testa platforma
- Plan creator: €20/lună (~$23.50) pentru utilizare recomandată
- API: Plată per utilizare prin Fal.ai și Replicate
- Enterprise: Prețuri personalizate pentru scară
Planul creator e surprinzător de accesibil având în vedere tehnologia. Compară asta cu angajarea unui artist foley sau licențierea bibliotecilor sonore profesionale.
Părerea mea
Am fost atât de concentrați pe a face videoul AI să arate mai bine încât am uitat că videoul e un mediu multisenzorial. Mirelo corectează această omisiune.
Încearcă să încarci unul dintre videourile tale generate de AI pe platforma Mirelo. Diferența dintre înainte și după e diferența dintre demo și livrabil.
Finanțarea de 41 de milioane de dolari sugerează că investitorii văd aceeași oportunitate. Audio-ul nu e o caracteristică opțională—e jumătate din ceea ce face videoul convingător.
Era filmului mut s-a încheiat în 1927 cu The Jazz Singer. Aproape un secol mai târziu, videoul AI are propriul său moment "talkies".
Mirelo pariază că pot fi sunetul acestei noi ere. Bazat pe tehnologia, echipa și timingul lor, acest pariu pare din ce în ce mai inteligent.
Cum să începi
- Vizitează mirelo.io pentru a explora platforma
- Încarcă un video AI mut
- Lasă Mirelo să genereze audio sincronizat
- Compară cu munca ta audio manuală
- Decide dacă automatizarea e gata pentru fluxul tău de lucru
Bariera de intrare e joasă. Economiile potențiale de timp sunt mari. Și tehnologia va continua să se îmbunătățească pe măsură ce acei 41 de milioane de dolari sunt implementați.
Sunetul are în sfârșit un loc la masa video AI.
Ți-a fost util acest articol?

Henry
Tehnologist CreativTehnologist creativ din Lausanne care explorează unde se întâlnește IA-ul cu arta. Experimentează cu modele generative între sesiuni de muzică electronică.
Articole Conexe
Continuă explorarea cu aceste articole conexe

Pika 2.5: Democratizarea Video-ului IA prin Viteză, Preț și Instrumente Creative
Pika Labs lansează versiunea 2.5, combinând generare mai rapidă, fizică îmbunătățită și instrumente creative precum Pikaframes și Pikaffects pentru a face video-ul IA accesibil tuturor.
Google Intră în Cursa Avatarilor IA: Veo 3.1 Alimentează Noi Avatari în Google Vids
Google îmbunătățește Vids cu avatari alimentați de Veo 3.1, promițând utilizatorilor enterprise o preferință de cinci ori mai mare decât concurenții. Cum se compară cu Synthesia și HeyGen?

Consistența Caracterelor în Video IA: Cum Modelele Învață să Țină Minte Fețele
O aprofundare tehnică în inovațiile arhitecturale care permit modelelor video IA să mențină identitatea personajului pe durata filmărilor, de la mecanismele de atenție la încorporări care preservă identitatea.