Meta Pixel
HenryHenry
6 min read
1019 słów

Mirelo zdobywa $41M na rozwiązanie cichego problemu wideo AI

Berliński startup Mirelo właśnie pozyskał $41 milionów od Index Ventures i a16z, by wprowadzić generowane przez AI efekty dźwiękowe do wideo. Wspierani przez szefów Mistral i Hugging Face, budują to, czego przemysł desperacko potrzebuje: inteligentne audio dla cichej rewolucji wideo.

Mirelo zdobywa $41M na rozwiązanie cichego problemu wideo AI

Za każdym razem, gdy generuję wideo AI, dzieje się to samo. Wizualizacje zapierają dech. Ruch jest płynny. Oświetlenie kinowe. Potem wciskam play i... cisza. Żyjemy w erze niemego kina i nawet tego nie zauważyłem do tej pory.

Zakład o $41 milionów na dźwięk

Mirelo, berliński startup założony przez badaczy AI, którzy akurat są muzykami, właśnie zamknął rundę seed na $41 milionów. Index Ventures i Andreessen Horowitz prowadzą inwestycję. To niemały zakład na audio.

💡

Całkowite finansowanie Mirelo wynosi teraz $44 miliony, włączając wcześniejsze wsparcie pre-seed od Atlantic. Lista aniołów brzmi jak galeria sław AI: Arthur Mensch (CEO Mistral), Thomas Wolf (chief science officer Hugging Face) i Burkay Gur (współzałożyciel Fal.ai).

Pitch jest elegancki: wgrywasz wideo, ich AI je ogląda i generuje idealnie zsynchronizowane efekty dźwiękowe. Nie generyczną muzykę w tle. Prawdziwe audio w stylu foley, które pasuje do tego, co dzieje się na ekranie.

Dlaczego to ma znaczenie teraz

Pomyśl o krajobrazie wideo AI w grudniu 2025:

  • Runway Gen-4.5 tworzy oszałamiające wizualizacje, ale bez natywnego audio
  • Sora 2 generuje klipy do 90 sekund—wszystkie ciche
  • Veo 3.1 właśnie dodał audio, ale tylko dla niektórych funkcji

Przemysł pędzi w stronę fotorealistycznej generacji, zostawiając w tyle połowę doświadczenia zmysłowego. Mirelo wypełnia tę lukę.

$41M
Seed Round
2-3x
Team Growth Target
€20/mo
Creator Plan

Jak działa Mirelo SFX

Ich flagowy model nazywa się Mirelo SFX v1.5. Z tego, co mogę wyłuskać z dokumentacji API i dem:

  1. Analiza sceny: Model ogląda twoje wideo i identyfikuje obiekty, akcje i kontekst środowiska
  2. Mapowanie czasowe: Określa, kiedy wydarzają się zdarzenia—zamykanie drzwi, kroki, tłuczące się szkło
  3. Generacja dźwięku: AI tworzy audio pasujące do wizualnego timingu i właściwości akustycznych
  4. Mikowanie: Wszystko jest warstwowane z odpowiednimi poziomami i pozycjonowaniem przestrzennym

Rezultat to nie efekty dźwiękowe przyklejone do wideo. To audio, które czuje się jak należące.

Input: Wideo AI przedstawiające deszcz uderzający w okno
Output: Krople deszczu o zmiennej intensywności, rezonans szkła, ambient pokojowy
Rezultat: Wideo nagle czuje się prawdziwe

Założyciele-muzycy

CJ Simon-Gabriel i Florian Wenzel są zarówno badaczami AI, jak i muzykami. Ta kombinacja ma większe znaczenie, niż mogłoby się wydawać.

Muzycy rozumieją coś o audio, co czyści inżynierowie ML mogą przegapić: timing jest wszystkim. Efekt dźwiękowy, który dociera 50 milisekund za późno, czuje się źle, nawet jeśli nie potrafisz świadomie określić dlaczego. Emocjonalny wpływ audio zależy od mikroskopijnej synchronizacji.

Ich podwójne wykształcenie widać w produkcie. Mirelo nie tylko generuje dźwięki—generuje je z muzycznością.

Strategia dystrybucji

Mirelo przyjmuje mądre podejście do rynku:

KanałCelStatus
Mirelo StudioBezpośrednie workspace dla twórcówDostępne
Fal.aiAPI dla deweloperówLive
ReplicateAlternatywny dostęp APILive
Freemium€20/miesiąc plan dla twórcówDostępne

Dystrybuując przez Fal.ai i Replicate, spotykają deweloperów tam, gdzie już budują. Jeśli tworzysz pipeline wideo AI, możesz wrzucić Mirelo do swojego stacku bez przebudowywania wszystkiego.

Konkurencja nadchodzi

Mirelo nie działa w próżni:

CompanyStrengthWeakness
MireloSpecjalistyczny focus + założyciele-muzycySkala startupu
ElevenLabsDominacja głosuMniejszy focus na SFX
Kling AI (Kuaishou)Zintegrowana platforma wideoMniejsza specjalizacja audio

Sony, Tencent i ElevenLabs grają w sąsiednich przestrzeniach. Ale laserowy focus Mirelo na efekty dźwiękowe dla wideo daje im przewagę. Nie próbują być wszystkim—próbują być doskonali w jednej rzeczy.

Etyka danych treningowych

Jeden szczegół mnie zaciekawił: Mirelo pozyskuje dane treningowe z publicznych i kupowanych bibliotek dźwiękowych, z partnerstwami dzielącymi się przychodami, które szanują prawa artystów.

To ma znaczenie. Przemysł AI staje w obliczu rosnącej kontroli nad praktykami danych treningowych. Mirelo wydaje się budować etycznie od podstaw, co może stać się przewagą konkurencyjną, gdy regulacje się zaostrzyją.

Co to znaczy dla twórców

Jeśli generujesz wideo AI dzisiaj, twój workflow prawdopodobnie wygląda tak:

  1. Generuj wizualizacje z Sora/Runway/Veo
  2. Eksportuj do oprogramowania edycyjnego
  3. Ręcznie dodaj efekty dźwiękowe z biblioteki
  4. Zsynchronizuj audio z wideo
  5. Dostosuj poziomy i timing
  6. Eksportuj finalne wideo

Z Mirelo kroki 3-5 zapadają się w jedno wywołanie API. Oszczędności czasu szybko się sumują, gdy produkujesz na masę.

Droga do muzyki AI

Mirelo ma generację muzyki AI w swojej mapie drogowej. Model efektów dźwiękowych to dopiero początek.

Wyobraź sobie generowanie wideo z:

  • Wizualizacjami generowanymi przez AI
  • Dialogiem generowanym przez AI (ElevenLabs)
  • Efektami dźwiękowymi generowanymi przez AI (Mirelo)
  • Soundtrackiem generowanym przez AI (przyszłość Mirelo)

Składamy elementy w całkowicie syntetyczne media. Czy to cię ekscytuje, czy przeraża, prawdopodobnie zależy od tego, co tworzysz na życie.

Ceny i dostęp

Dla twórców chcących wypróbować Mirelo:

  • Darmowy tier: Ograniczone generacje do testowania platformy
  • Plan dla twórców: €20/miesiąc (~$23.50) dla zalecanego użycia
  • API: Pay-per-use przez Fal.ai i Replicate
  • Enterprise: Custom pricing dla skali

Plan dla twórców jest zaskakująco przystępny cenowo, biorąc pod uwagę technologię. Porównaj to z zatrudnieniem foley artysty lub licencjonowaniem profesjonalnych bibliotek dźwiękowych.

Moje zdanie

Byliśmy tak skupieni na tym, by wideo AI wyglądało lepiej, że zapomnieliśmy, iż wideo to medium wielozmysłowe. Mirelo koryguje to przeoczenie.

💡

Spróbuj wgrać jedno ze swoich wideo generowanych przez AI na platformę Mirelo. Różnica między przed i po to różnica między demo a produktem gotowym do dostarczenia.

$41 milionów finansowania sugeruje, że inwestorzy widzą tę samą okazję. Audio to nie funkcja nice-to-have—to połowa tego, co czyni wideo przekonującym.

Era niemego kina zakończyła się w 1927 z The Jazz Singer. Prawie wiek później, wideo AI przeżywa swój własny moment "filmów dźwiękowych".

Mirelo stawia, że mogą być dźwiękiem tej nowej ery. Na podstawie ich technologii, zespołu i timingu, ten zakład wygląda coraz mądrzej.

Jak zacząć

  1. Odwiedź mirelo.io, by zbadać platformę
  2. Wgraj ciche wideo AI
  3. Pozwól Mirelo wygenerować zsynchronizowane audio
  4. Porównaj ze swoją ręczną pracą nad audio
  5. Zdecyduj, czy automatyzacja jest gotowa na twój workflow

Bariera wejścia jest niska. Potencjalne oszczędności czasu są wysokie. A technologia tylko się poprawi, gdy te $41 milionów zostanie wdrożone.

Dźwięk w końcu ma miejsce przy stole wideo AI.

Czy ten artykuł był pomocny?

Henry

Henry

Technolog Kreatywny

Technolog kreatywny z Lozanny badający, gdzie AI spotyka się ze sztuką. Eksperymentuje z modelami generatywnymi między sesjami muzyki elektronicznej.

Powiązane artykuły

Kontynuuj eksplorację dzięki tym powiązanym wpisom

Spodobał Ci się ten artykuł?

Odkryj więcej inspiracji i bądź na bieżąco z naszymi najnowszymi treściami.

Mirelo zdobywa $41M na rozwiązanie cichego problemu wideo AI