Mirelo erhält 41 Millionen Dollar zur Lösung des Tonproblems von KI-Videos
Das Berliner Startup Mirelo sichert sich 41 Millionen Dollar von Index Ventures und a16z, um KI-generierte Soundeffekte für Videos zu entwickeln. Mit Unterstützung von Führungskräften von Mistral und Hugging Face entwickeln sie, was die Branche dringend benötigt: intelligente Audiobegleitung für die Revolution des stummen Videos.

Jedes Mal, wenn ich ein KI-Video generiere, passiert dasselbe. Die Visualisierung beeindruckt mich. Die Bewegungen sind flüssig. Die Beleuchtung ist kinoreif. Dann drücke ich auf Play und... nichts. Stille. Wir befinden uns in einer Stummfilm-Ära, und ich hatte es bis jetzt nicht realisiert.
Die 41-Millionen-Dollar-Investition in Sound
Mirelo, ein Berliner Startup, gegründet von KI-Forschern, die gleichzeitig Musiker sind, hat gerade eine 41-Millionen-Dollar-Seed-Finanzierung abgeschlossen. Index Ventures und Andreessen Horowitz führten die Investition an. Das ist keine kleine Wette auf Audio.
Mirelos Gesamtfinanzierung beträgt nun 44 Millionen Dollar, einschließlich der vorherigen Pre-Seed-Unterstützung von Atlantic. Die Liste der Angel-Investoren liest sich wie eine KI-Ruhmeshalle: Arthur Mensch (Mistral CEO), Thomas Wolf (Hugging Face Chief Science Officer) und Burkay Gur (Fal.ai Co-Founder).
Das Konzept ist elegant: Sie laden ein Video hoch, ihre KI analysiert es und generiert perfekt synchronisierte Soundeffekte. Keine generische Hintergrundmusik. Tatsächliche Foley-artige Audioaufnahmen, die exakt zu den Geschehnissen auf dem Bildschirm passen.
Warum das jetzt relevant ist
Betrachten Sie die KI-Video-Landschaft im Dezember 2025:
- Runway Gen-4.5 produziert beeindruckende Visualisierungen, aber keine native Audioausgabe
- Sora 2 generiert bis zu 90 Sekunden lange Clips—alle stumm
- Veo 3.1 hat gerade Audio hinzugefügt, aber nur für bestimmte Funktionen
Die Branche ist auf fotorealistische Generierung zugesteuert, während sie die Hälfte des sensorischen Erlebnisses vernachlässigt hat. Mirelo füllt diese Lücke.
Funktionsweise von Mirelo SFX
Ihr Flaggschiff-Modell heißt Mirelo SFX v1.5. Aus ihrer API-Dokumentation und den Demos lässt sich Folgendes ableiten:
- Szenenanalyse: Das Modell analysiert Ihr Video und identifiziert Objekte, Handlungen und Umgebungskontext
- Zeitliche Zuordnung: Es ermittelt, wann Ereignisse stattfinden—eine sich schließende Tür, Schritte, zerbrechendes Glas
- Soundgenerierung: KI erstellt Audio, das zum visuellen Timing und den akustischen Eigenschaften passt
- Mischung: Alles wird mit entsprechenden Pegeln und räumlicher Positionierung zusammengeführt
Das Ergebnis sind nicht einfach auf das Video aufgelegte Soundeffekte. Es ist Audio, das authentisch wirkt.
Eingabe: KI-generiertes Video von Regen auf einem Fenster
Ausgabe: Regentropfen mit variierender Intensität, Glasresonanz, Raumambiente
Ergebnis: Das Video wirkt plötzlich realDie musikalischen Gründer
CJ Simon-Gabriel und Florian Wenzel sind beide KI-Forscher und Musiker. Diese Kombination ist bedeutsamer, als man denken könnte.
Musiker verstehen etwas über Audio, das reinen ML-Ingenieuren möglicherweise entgeht: Timing ist alles. Ein Soundeffekt, der 50 Millisekunden zu spät kommt, wirkt falsch, auch wenn man nicht bewusst identifizieren kann, warum. Die emotionale Wirkung von Audio hängt von mikroskopischer Synchronisation ab.
Ihr dualer Hintergrund zeigt sich im Produkt. Mirelo generiert nicht nur Sounds—sie generiert sie mit Musikalität.
Die Vertriebsstrategie
Mirelo verfolgt einen intelligenten Marktansatz:
| Kanal | Zweck | Status |
|---|---|---|
| Mirelo Studio | Direkter Creator-Workspace | Verfügbar |
| Fal.ai | API für Entwickler | Live |
| Replicate | Alternativer API-Zugang | Live |
| Freemium | 20 €/Monat Creator-Tarif | Verfügbar |
Durch die Verteilung über Fal.ai und Replicate erreichen sie Entwickler dort, wo diese bereits entwickeln. Wenn Sie eine KI-Video-Pipeline erstellen, können Sie Mirelo in Ihren Stack integrieren, ohne alles neu aufzubauen.
Konkurrenz entsteht
Mirelo operiert nicht im luftleeren Raum:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Spezialisierter Fokus + Musiker-Gründer | Startup-Skalierung |
| ElevenLabs | Dominanz bei Sprachsynthese | Weniger SFX-Fokus |
| Kling AI (Kuaishou) | Integrierte Videoplattform | Weniger Audio-Spezialisierung |
Sony, Tencent und ElevenLabs agieren alle in angrenzenden Bereichen. Aber Mirelos präziser Fokus auf Soundeffekte für Videos verschafft ihnen einen Vorteil. Sie versuchen nicht, alles zu sein—sie versuchen, in einer Sache exzellent zu sein.
Die Ethik der Trainingsdaten
Ein Detail fiel mir besonders auf: Mirelo bezieht Trainingsdaten aus öffentlichen und gekauften Sound-Bibliotheken, mit Umsatzbeteiligungspartnerschaften, die Künstlerrechte respektieren.
Das ist relevant. Die KI-Branche sieht sich zunehmender Prüfung ihrer Trainingsdatenpraktiken ausgesetzt. Mirelo scheint von Grund auf ethisch zu arbeiten, was sich zu einem Wettbewerbsvorteil entwickeln könnte, sobald die Regulierung verschärft wird.
Was das für Creator bedeutet
Wenn Sie heute KI-Videos generieren, sieht Ihr Workflow wahrscheinlich so aus:
- Visuals mit Sora/Runway/Veo generieren
- In Bearbeitungssoftware exportieren
- Manuell Soundeffekte aus Bibliotheken hinzufügen
- Audio mit Video synchronisieren
- Pegel und Timing anpassen
- Finales Video exportieren
Mit Mirelo kollabieren die Schritte 3-5 zu einem einzigen API-Aufruf. Die Zeitersparnis potenziert sich schnell, wenn Sie in großem Umfang produzieren.
Der Weg zur KI-Musik
Mirelo hat KI-Musikgenerierung auf ihrer Roadmap. Das Soundeffekt-Modell ist erst der Anfang.
Stellen Sie sich vor, ein Video zu generieren mit:
- KI-generierten Visualisierungen
- KI-generiertem Dialog (ElevenLabs)
- KI-generierten Soundeffekten (Mirelo)
- KI-generiertem Soundtrack (zukünftiges Mirelo)
Wir fügen die Teile für vollständig synthetische Medien zusammen. Ob Sie das begeistert oder beunruhigt, hängt vermutlich davon ab, womit Sie beruflich arbeiten.
Preisgestaltung und Zugang
Für Creator, die Mirelo testen möchten:
- Kostenloser Tarif: Begrenzte Generierungen zum Testen der Plattform
- Creator-Tarif: 20 €/Monat (~23,50 $) für empfohlene Nutzung
- API: Pay-per-Use über Fal.ai und Replicate
- Enterprise: Individuelle Preisgestaltung für Skalierung
Der Creator-Tarif ist angesichts der Technologie erstaunlich erschwinglich. Vergleichen Sie das mit der Beauftragung eines Foley-Artists oder der Lizenzierung professioneller Sound-Bibliotheken.
Meine Einschätzung
Wir waren so fokussiert darauf, KI-Videos besser aussehen zu lassen, dass wir vergessen haben, dass Video ein multisensorisches Medium ist. Mirelo korrigiert dieses Versäumnis.
Laden Sie eines Ihrer KI-generierten Videos auf die Mirelo-Plattform hoch. Der Unterschied zwischen vorher und nachher ist der Unterschied zwischen Demo und lieferbarem Produkt.
Die 41 Millionen Dollar Finanzierung deuten darauf hin, dass Investoren dieselbe Chance sehen. Audio ist kein Nice-to-have-Feature—es ist die Hälfte dessen, was Videos fesselnd macht.
Die Stummfilm-Ära endete 1927 mit The Jazz Singer. Fast ein Jahrhundert später erlebt KI-Video seinen eigenen "Tonfilm"-Moment.
Mirelo setzt darauf, dass sie der Sound dieser neuen Ära sein können. Basierend auf ihrer Technologie, ihrem Team und ihrem Timing erscheint diese Wette zunehmend klug.
Erste Schritte
- Besuchen Sie mirelo.io, um die Plattform zu erkunden
- Laden Sie ein stummes KI-Video hoch
- Lassen Sie Mirelo synchronisiertes Audio generieren
- Vergleichen Sie mit Ihrer manuellen Audioarbeit
- Entscheiden Sie, ob die Automatisierung für Ihren Workflow bereit ist
Die Einstiegshürde ist niedrig. Die potenziellen Zeitersparnisse sind hoch. Und die Technologie wird sich nur verbessern, während diese 41 Millionen Dollar eingesetzt werden.
Sound hat endlich einen Platz am KI-Video-Tisch.
War dieser Artikel hilfreich?

Henry
KreativtechnologeKreativtechnologe aus Lausanne, der erforscht, wo KI auf Kunst trifft. Experimentiert mit generativen Modellen zwischen seinen elektronischen Musiksessions.
Verwandte Artikel
Entdecken Sie weitere verwandte Beiträge

Pika 2.5: KI-Video durch Geschwindigkeit, Preis und kreative Werkzeuge zugänglich machen
Pika Labs veröffentlicht Version 2.5, die schnellere Generierung, verbesserte Physik und kreative Werkzeuge wie Pikaframes und Pikaffects kombiniert, um KI-Video für jeden zugänglich zu machen.
Google betritt den Avatar-Markt: Veo 3.1 stärkt neue Avatare in Google Vids
Google rüstet Vids mit Veo 3.1 betriebenen Avataren auf und verspricht Unternehmensnutzern fünfmal bessere Vorlieben gegenüber Konkurrenten. Wie schneidet dies gegen Synthesia und HeyGen ab?

Der vollständige Leitfaden für AI Video Prompt Engineering 2025
Beherrschen Sie die Kunst, Prompts zu erstellen, die hochwertige AI-generierte Videos erzeugen. Lernen Sie das Sechs-Ebenen-Framework, filmische Terminologie und plattformspezifische Techniken.