Mirelo får $41M för att lösa AI-videos tysta problem
Berlinstartup Mirelo har precis säkrat $41 miljoner från Index Ventures och a16z för att införa AI-genererade ljudeffekter till video. Med stöd från chefer på Mistral och Hugging Face bygger de det industrin desperat behöver: intelligent ljud för den tysta videorevolutionen.

Varje gång jag genererar en AI-video händer samma sak. Bilderna tar andan ur mig. Rörelsen är flytande. Ljussättningen är filmisk. Sen trycker jag på play och... inget. Tystnad. Vi har levt genom en stumfilmsera och jag insåg det inte ens förrän nu.
$41 miljoner-satsningen på ljud
Mirelo, en Berlinbaserad startup grundad av AI-forskare som råkar vara musiker, har precis stängt en $41 miljoner seed-runda. Index Ventures och Andreessen Horowitz ledde investeringen. Det är ingen liten satsning på ljud.
Mirelos totala finansiering står nu på $44 miljoner, inklusive tidigare pre-seed från Atlantic. Ängellistan läses som en AI hall of fame: Arthur Mensch (Mistral CEO), Thomas Wolf (Hugging Face chief science officer) och Burkay Gur (Fal.ai medgrundare).
Pitchen är elegant: du laddar upp en video, deras AI tittar på den och genererar perfekt synkroniserade ljudeffekter. Inte generisk bakgrundsmusik. Faktisk foley-stil-ljud som matchar vad som händer på skärmen.
Varför detta spelar roll nu
Tänk på AI-videolandskapet i december 2025:
- Runway Gen-4.5 producerar fantastiska bilder men inget nativt ljud
- Sora 2 genererar klipp upp till 90 sekunder—alla tysta
- Veo 3.1 har precis lagt till ljud, men bara för vissa funktioner
Industrin har sprintat mot fotorealistisk generering medan den lämnar halva den sensoriska upplevelsen bakom. Mirelo fyller det gapet.
Hur Mirelo SFX fungerar
Deras flaggskeppsmodell kallas Mirelo SFX v1.5. Från vad jag kan pussla ihop från deras API-dokumentation och demos:
- Scenanalys: Modellen tittar på din video och identifierar objekt, handlingar och miljökontext
- Temporal kartläggning: Den räknar ut när händelser inträffar—en dörr stängs, fotsteg, glas krossas
- Ljudgenerering: AI skapar ljud som matchar den visuella timingen och akustiska egenskaperna
- Mixning: Allt läggs i lager tillsammans med lämpliga nivåer och rumslig positionering
Resultatet är inte bara ljudeffekter slängda på video. Det är ljud som känns som det hör hemma.
Input: AI-genererad video av regn som slår mot ett fönster
Output: Regndroppar med varierande intensitet, glasresonans, ambient rumston
Resultat: Videon känns plötsligt verkligMusikergrundarna
CJ Simon-Gabriel och Florian Wenzel är båda AI-forskare och musiker. Den kombinationen spelar större roll än du kanske tror.
Musiker förstår något om ljud som rena ML-ingenjörer kan missa: timing är allt. En ljudeffekt som kommer 50 millisekunder för sent känns fel även om du inte medvetet kan identifiera varför. Den känslomässiga effekten av ljud beror på mikroskopisk synkronisering.
Deras dubbla bakgrund syns i produkten. Mirelo genererar inte bara ljud—det genererar dem med musikalitet.
Distributionsstrategin
Mirelo tar ett smart grepp på marknaden:
| Kanal | Syfte | Status |
|---|---|---|
| Mirelo Studio | Direkt creator workspace | Tillgänglig |
| Fal.ai | API för utvecklare | Live |
| Replicate | Alternativ API-åtkomst | Live |
| Freemium | €20/månad creator-plan | Tillgänglig |
Genom att distribuera via Fal.ai och Replicate möter de utvecklare där de redan bygger. Om du skapar en AI-videopipeline kan du släppa in Mirelo i din stack utan att bygga om allt.
Konkurrensen kommer
Mirelo verkar inte i ett vakuum:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Specialiserat fokus + musikergrundare | Startup-skala |
| ElevenLabs | Röstdominans | Mindre SFX-fokus |
| Kling AI (Kuaishou) | Integrerad videoplattform | Mindre ljudspecialisering |
Sony, Tencent och ElevenLabs spelar alla i angränsande utrymmen. Men Mirelos laserfokus på ljudeffekter för video ger dem ett övertag. De försöker inte vara allt—de försöker vara utmärkta på en sak.
Etiken i träningsdata
En detalj stack ut för mig: Mirelo hämtar träningsdata från offentliga och köpta ljudbibliotek, med intäktsdelande partnerskap som respekterar artisträttigheter.
Detta spelar roll. AI-industrin möter ökande granskning över träningsdatapraxis. Mirelo verkar bygga etiskt från grunden, vilket kan bli en konkurrensfördel när regleringar stramar åt.
Vad detta betyder för skapare
Om du genererar AI-video idag ser ditt arbetsflöde förmodligen ut så här:
- Generera bilder med Sora/Runway/Veo
- Exportera till redigeringsprogramvara
- Lägg till ljudeffekter från bibliotek manuellt
- Synkronisera ljud med video
- Justera nivåer och timing
- Exportera slutlig video
Med Mirelo faller steg 3-5 ihop till ett API-anrop. Tidsbesparingarna växer snabbt när du producerar volym.
Vägen till AI-musik
Mirelo har AI-musikgenerering på sin roadmap. Ljudeffektsmodellen är bara början.
Föreställ dig att generera en video med:
- AI-genererade bilder
- AI-genererad dialog (ElevenLabs)
- AI-genererade ljudeffekter (Mirelo)
- AI-genererat soundtrack (framtida Mirelo)
Vi monterar ihop bitarna för helt syntetiska medier. Om det gör dig exalterad eller skrämmer dig beror förmodligen på vad du skapar för att leva.
Prissättning och tillgång
För skapare som vill prova Mirelo:
- Gratis nivå: Begränsade genereringar för att testa plattformen
- Creator-plan: €20/månad (~$23.50) för rekommenderad användning
- API: Pay-per-use genom Fal.ai och Replicate
- Enterprise: Anpassad prissättning för skala
Creator-planen är förvånansvärt överkomlig med tanke på teknologin. Jämför det med att anställa en foley-artist eller licensiera professionella ljudbibliotek.
Min åsikt
Vi har varit så fokuserade på att få AI-video att se bättre ut att vi glömde att video är ett flersensoriskt medium. Mirelo korrigerar den förbiseendet.
Prova att ladda upp en av dina AI-genererade videor till Mirelos plattform. Skillnaden mellan före och efter är skillnaden mellan demo och leveransbar.
De $41 miljoner i finansiering tyder på att investerare ser samma möjlighet. Ljud är inte en nice-to-have-funktion—det är halva det som gör video övertygande.
Stumfilmseran slutade 1927 med The Jazz Singer. Nästan ett sekel senare har AI-video sitt eget "talkies"-ögonblick.
Mirelo satsar på att de kan vara ljudet av denna nya era. Baserat på deras teknologi, deras team och deras timing ser den satsningen alltmer smart ut.
Komma igång
- Besök mirelo.io för att utforska plattformen
- Ladda upp en tyst AI-video
- Låt Mirelo generera synkroniserat ljud
- Jämför med ditt manuella ljudarbete
- Bestäm om automatisering är redo för ditt arbetsflöde
Tröskeln är låg. Den potentiella tidsbesparingen är hög. Och teknologin kommer bara att förbättras när de $41 miljonen används.
Ljud har äntligen en plats vid AI-videobordet.
Var den här artikeln hjälpsam?

Henry
Kreativ teknologKreativ teknolog från Lausanne som utforskar var AI möter konst. Experimenterar med generativa modeller mellan elektroniska musiksessioner.
Relaterade artiklar
Fortsätt utforska med dessa relaterade inlägg

Pika 2.5: Demokratisering av AI-video genom hastighet, pris och kreativa verktyg
Pika Labs släpper version 2.5, som kombinerar snabbare generering, förbättrad fysik och kreativa verktyg som Pikaframes och Pikaffects för att göra AI-video tillgängligt för alla.
Google går in i AI-avatarkampen: Veo 3.1 driver nya avatarer i Google Vids
Google uppgraderar Vids med Veo 3.1-drivna avatarer, utlovat företagsanvändare fem gånger bättre preferens än konkurrenter. Hur håller det jämfört med Synthesia och HeyGen?

Komplett guide till AI-videoprompt-engineering 2025
Lär dig skapa prompter som ger professionella AI-genererade videor. Upptäck sexskiktsramverket, filmterminologi och plattformsspecifika tekniker.