Mirelo zdobywa $41M na rozwiązanie cichego problemu wideo AI
Berliński startup Mirelo właśnie pozyskał $41 milionów od Index Ventures i a16z, by wprowadzić generowane przez AI efekty dźwiękowe do wideo. Wspierani przez szefów Mistral i Hugging Face, budują to, czego przemysł desperacko potrzebuje: inteligentne audio dla cichej rewolucji wideo.

Za każdym razem, gdy generuję wideo AI, dzieje się to samo. Wizualizacje zapierają dech. Ruch jest płynny. Oświetlenie kinowe. Potem wciskam play i... cisza. Żyjemy w erze niemego kina i nawet tego nie zauważyłem do tej pory.
Zakład o $41 milionów na dźwięk
Mirelo, berliński startup założony przez badaczy AI, którzy akurat są muzykami, właśnie zamknął rundę seed na $41 milionów. Index Ventures i Andreessen Horowitz prowadzą inwestycję. To niemały zakład na audio.
Całkowite finansowanie Mirelo wynosi teraz $44 miliony, włączając wcześniejsze wsparcie pre-seed od Atlantic. Lista aniołów brzmi jak galeria sław AI: Arthur Mensch (CEO Mistral), Thomas Wolf (chief science officer Hugging Face) i Burkay Gur (współzałożyciel Fal.ai).
Pitch jest elegancki: wgrywasz wideo, ich AI je ogląda i generuje idealnie zsynchronizowane efekty dźwiękowe. Nie generyczną muzykę w tle. Prawdziwe audio w stylu foley, które pasuje do tego, co dzieje się na ekranie.
Dlaczego to ma znaczenie teraz
Pomyśl o krajobrazie wideo AI w grudniu 2025:
- Runway Gen-4.5 tworzy oszałamiające wizualizacje, ale bez natywnego audio
- Sora 2 generuje klipy do 90 sekund—wszystkie ciche
- Veo 3.1 właśnie dodał audio, ale tylko dla niektórych funkcji
Przemysł pędzi w stronę fotorealistycznej generacji, zostawiając w tyle połowę doświadczenia zmysłowego. Mirelo wypełnia tę lukę.
Jak działa Mirelo SFX
Ich flagowy model nazywa się Mirelo SFX v1.5. Z tego, co mogę wyłuskać z dokumentacji API i dem:
- Analiza sceny: Model ogląda twoje wideo i identyfikuje obiekty, akcje i kontekst środowiska
- Mapowanie czasowe: Określa, kiedy wydarzają się zdarzenia—zamykanie drzwi, kroki, tłuczące się szkło
- Generacja dźwięku: AI tworzy audio pasujące do wizualnego timingu i właściwości akustycznych
- Mikowanie: Wszystko jest warstwowane z odpowiednimi poziomami i pozycjonowaniem przestrzennym
Rezultat to nie efekty dźwiękowe przyklejone do wideo. To audio, które czuje się jak należące.
Input: Wideo AI przedstawiające deszcz uderzający w okno
Output: Krople deszczu o zmiennej intensywności, rezonans szkła, ambient pokojowy
Rezultat: Wideo nagle czuje się prawdziweZałożyciele-muzycy
CJ Simon-Gabriel i Florian Wenzel są zarówno badaczami AI, jak i muzykami. Ta kombinacja ma większe znaczenie, niż mogłoby się wydawać.
Muzycy rozumieją coś o audio, co czyści inżynierowie ML mogą przegapić: timing jest wszystkim. Efekt dźwiękowy, który dociera 50 milisekund za późno, czuje się źle, nawet jeśli nie potrafisz świadomie określić dlaczego. Emocjonalny wpływ audio zależy od mikroskopijnej synchronizacji.
Ich podwójne wykształcenie widać w produkcie. Mirelo nie tylko generuje dźwięki—generuje je z muzycznością.
Strategia dystrybucji
Mirelo przyjmuje mądre podejście do rynku:
| Kanał | Cel | Status |
|---|---|---|
| Mirelo Studio | Bezpośrednie workspace dla twórców | Dostępne |
| Fal.ai | API dla deweloperów | Live |
| Replicate | Alternatywny dostęp API | Live |
| Freemium | €20/miesiąc plan dla twórców | Dostępne |
Dystrybuując przez Fal.ai i Replicate, spotykają deweloperów tam, gdzie już budują. Jeśli tworzysz pipeline wideo AI, możesz wrzucić Mirelo do swojego stacku bez przebudowywania wszystkiego.
Konkurencja nadchodzi
Mirelo nie działa w próżni:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Specjalistyczny focus + założyciele-muzycy | Skala startupu |
| ElevenLabs | Dominacja głosu | Mniejszy focus na SFX |
| Kling AI (Kuaishou) | Zintegrowana platforma wideo | Mniejsza specjalizacja audio |
Sony, Tencent i ElevenLabs grają w sąsiednich przestrzeniach. Ale laserowy focus Mirelo na efekty dźwiękowe dla wideo daje im przewagę. Nie próbują być wszystkim—próbują być doskonali w jednej rzeczy.
Etyka danych treningowych
Jeden szczegół mnie zaciekawił: Mirelo pozyskuje dane treningowe z publicznych i kupowanych bibliotek dźwiękowych, z partnerstwami dzielącymi się przychodami, które szanują prawa artystów.
To ma znaczenie. Przemysł AI staje w obliczu rosnącej kontroli nad praktykami danych treningowych. Mirelo wydaje się budować etycznie od podstaw, co może stać się przewagą konkurencyjną, gdy regulacje się zaostrzyją.
Co to znaczy dla twórców
Jeśli generujesz wideo AI dzisiaj, twój workflow prawdopodobnie wygląda tak:
- Generuj wizualizacje z Sora/Runway/Veo
- Eksportuj do oprogramowania edycyjnego
- Ręcznie dodaj efekty dźwiękowe z biblioteki
- Zsynchronizuj audio z wideo
- Dostosuj poziomy i timing
- Eksportuj finalne wideo
Z Mirelo kroki 3-5 zapadają się w jedno wywołanie API. Oszczędności czasu szybko się sumują, gdy produkujesz na masę.
Droga do muzyki AI
Mirelo ma generację muzyki AI w swojej mapie drogowej. Model efektów dźwiękowych to dopiero początek.
Wyobraź sobie generowanie wideo z:
- Wizualizacjami generowanymi przez AI
- Dialogiem generowanym przez AI (ElevenLabs)
- Efektami dźwiękowymi generowanymi przez AI (Mirelo)
- Soundtrackiem generowanym przez AI (przyszłość Mirelo)
Składamy elementy w całkowicie syntetyczne media. Czy to cię ekscytuje, czy przeraża, prawdopodobnie zależy od tego, co tworzysz na życie.
Ceny i dostęp
Dla twórców chcących wypróbować Mirelo:
- Darmowy tier: Ograniczone generacje do testowania platformy
- Plan dla twórców: €20/miesiąc (~$23.50) dla zalecanego użycia
- API: Pay-per-use przez Fal.ai i Replicate
- Enterprise: Custom pricing dla skali
Plan dla twórców jest zaskakująco przystępny cenowo, biorąc pod uwagę technologię. Porównaj to z zatrudnieniem foley artysty lub licencjonowaniem profesjonalnych bibliotek dźwiękowych.
Moje zdanie
Byliśmy tak skupieni na tym, by wideo AI wyglądało lepiej, że zapomnieliśmy, iż wideo to medium wielozmysłowe. Mirelo koryguje to przeoczenie.
Spróbuj wgrać jedno ze swoich wideo generowanych przez AI na platformę Mirelo. Różnica między przed i po to różnica między demo a produktem gotowym do dostarczenia.
$41 milionów finansowania sugeruje, że inwestorzy widzą tę samą okazję. Audio to nie funkcja nice-to-have—to połowa tego, co czyni wideo przekonującym.
Era niemego kina zakończyła się w 1927 z The Jazz Singer. Prawie wiek później, wideo AI przeżywa swój własny moment "filmów dźwiękowych".
Mirelo stawia, że mogą być dźwiękiem tej nowej ery. Na podstawie ich technologii, zespołu i timingu, ten zakład wygląda coraz mądrzej.
Jak zacząć
- Odwiedź mirelo.io, by zbadać platformę
- Wgraj ciche wideo AI
- Pozwól Mirelo wygenerować zsynchronizowane audio
- Porównaj ze swoją ręczną pracą nad audio
- Zdecyduj, czy automatyzacja jest gotowa na twój workflow
Bariera wejścia jest niska. Potencjalne oszczędności czasu są wysokie. A technologia tylko się poprawi, gdy te $41 milionów zostanie wdrożone.
Dźwięk w końcu ma miejsce przy stole wideo AI.
Czy ten artykuł był pomocny?

Henry
Technolog KreatywnyTechnolog kreatywny z Lozanny badający, gdzie AI spotyka się ze sztuką. Eksperymentuje z modelami generatywnymi między sesjami muzyki elektronicznej.
Powiązane artykuły
Kontynuuj eksplorację dzięki tym powiązanym wpisom

Pika 2.5: Dostępne AI-wideo przez szybkość, cenę i narzędzia
Pika Labs wydaje wersję 2.5 z szybszą generacją, ulepszoną fizyką i narzędziami jak Pikaframes i Pikaffects do pracy z wideo.
Google Wchodzi do Wyścigu Awatarów AI: Veo 3.1 Napędza Nowe Awatary w Google Vids
Google udoskonala Vids za pomocą awatarów napędzanych Veo 3.1, obiecując użytkownikom korporacyjnym pięciokrotnie wyższą preferencję od konkurencji. Jak to wypada w stosunku do Synthesia i HeyGen?

Kompletny przewodnik po prompt engineeringu dla AI video w 2025 roku
Opanuj sztukę tworzenia promptów, które generują oszałamiające filmy AI. Poznaj framework sześciu warstw, terminologię filmową i techniki specyficzne dla poszczególnych platform.