Mirelo lève 41 millions de dollars pour résoudre le problème silencieux de la vidéo IA
La startup berlinoise Mirelo vient d'obtenir 41 millions de dollars d'Index Ventures et a16z pour apporter des effets sonores générés par IA aux vidéos. Avec le soutien de dirigeants de Mistral et Hugging Face, ils construisent ce dont l'industrie a désespérément besoin : l'audio intelligent pour la révolution vidéo silencieuse.

À chaque fois que je génère une vidéo par IA, la même chose se produit. Les visuels me coupent le souffle. Le mouvement est fluide. L'éclairage est cinématographique. Puis j'appuie sur lecture et... rien. Le silence. Nous vivions une ère du cinéma muet, et je ne m'en étais même pas rendu compte jusqu'à maintenant.
Le pari de 41 millions de dollars sur le son
Mirelo, une startup berlinoise fondée par des chercheurs en IA qui sont aussi musiciens, vient de boucler un tour de table de 41 millions de dollars. Index Ventures et Andreessen Horowitz ont mené l'investissement. Ce n'est pas un petit pari sur l'audio.
Le financement total de Mirelo s'élève désormais à 44 millions de dollars, incluant le pré-seed précédent d'Atlantic. La liste des business angels se lit comme un panthéon de l'IA : Arthur Mensch (PDG de Mistral), Thomas Wolf (directeur scientifique de Hugging Face) et Burkay Gur (cofondateur de Fal.ai).
Le concept est élégant : vous téléchargez une vidéo, leur IA la regarde et génère des effets sonores parfaitement synchronisés. Pas de musique de fond générique. De véritables audios de type foley qui correspondent à ce qui se passe à l'écran.
Pourquoi c'est important maintenant
Pensez au paysage de la vidéo IA en décembre 2025 :
- Runway Gen-4.5 produit des visuels époustouflants mais aucun audio natif
- Sora 2 génère des clips jusqu'à 90 secondes—tous silencieux
- Veo 3.1 vient d'ajouter l'audio, mais seulement pour certaines fonctionnalités
L'industrie a sprinté vers la génération photoréaliste tout en laissant derrière elle la moitié de l'expérience sensorielle. Mirelo comble cette lacune.
Comment fonctionne Mirelo SFX
Leur modèle phare s'appelle Mirelo SFX v1.5. D'après ce que je peux déduire de leur documentation API et de leurs démos :
- Analyse de scène : Le modèle regarde votre vidéo et identifie les objets, les actions et le contexte environnemental
- Cartographie temporelle : Il détermine quand les événements se produisent—une porte qui se ferme, des pas, du verre qui se brise
- Génération sonore : L'IA crée un audio qui correspond au timing visuel et aux propriétés acoustiques
- Mixage : Tout est superposé avec des niveaux et un positionnement spatial appropriés
Le résultat n'est pas simplement des effets sonores plaqués sur la vidéo. C'est un audio qui semble appartenir naturellement à l'ensemble.
Entrée : Vidéo générée par IA de pluie frappant une fenêtre
Sortie : Gouttes de pluie avec intensité variable, résonance du verre, ton ambiant de la pièce
Résultat : La vidéo semble soudainement réelleLes fondateurs musiciens
CJ Simon-Gabriel et Florian Wenzel sont à la fois chercheurs en IA et musiciens. Cette combinaison compte plus qu'on ne pourrait le penser.
Les musiciens comprennent quelque chose à propos de l'audio que les purs ingénieurs ML pourraient manquer : le timing est tout. Un effet sonore qui arrive 50 millisecondes en retard semble faux même si vous ne pouvez pas identifier consciemment pourquoi. L'impact émotionnel de l'audio dépend d'une synchronisation microscopique.
Leur double formation se voit dans le produit. Mirelo ne génère pas simplement des sons—il les génère avec musicalité.
La stratégie de distribution
Mirelo adopte une approche intelligente du marché :
| Canal | Objectif | Statut |
|---|---|---|
| Mirelo Studio | Espace de travail créateur direct | Disponible |
| Fal.ai | API pour développeurs | En ligne |
| Replicate | Accès API alternatif | En ligne |
| Freemium | Forfait créateur 20 €/mois | Disponible |
En distribuant via Fal.ai et Replicate, ils rencontrent les développeurs là où ils construisent déjà. Si vous créez un pipeline vidéo IA, vous pouvez intégrer Mirelo dans votre stack sans tout reconstruire.
La concurrence arrive
Mirelo n'opère pas dans le vide :
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Focus spécialisé + Fondateurs musiciens | Échelle startup |
| ElevenLabs | Domination de la voix | Moins de focus SFX |
| Kling AI (Kuaishou) | Plateforme vidéo intégrée | Moins de spécialisation audio |
Sony, Tencent et ElevenLabs jouent tous dans des espaces adjacents. Mais la concentration laser de Mirelo sur les effets sonores pour la vidéo leur donne un avantage. Ils n'essaient pas d'être tout—ils essaient d'être excellents dans une chose.
L'éthique des données d'entraînement
Un détail m'a particulièrement frappé : Mirelo source ses données d'entraînement à partir de bibliothèques sonores publiques et achetées, avec des partenariats de partage de revenus qui respectent les droits des artistes.
C'est important. L'industrie de l'IA fait face à un examen croissant concernant les pratiques de données d'entraînement. Mirelo semble construire de manière éthique dès le départ, ce qui pourrait devenir un avantage concurrentiel à mesure que les réglementations se durcissent.
Ce que cela signifie pour les créateurs
Si vous générez des vidéos IA aujourd'hui, votre flux de travail ressemble probablement à ceci :
- Générer les visuels avec Sora/Runway/Veo
- Exporter vers un logiciel de montage
- Ajouter manuellement des effets sonores depuis une bibliothèque
- Synchroniser l'audio avec la vidéo
- Ajuster les niveaux et le timing
- Exporter la vidéo finale
Avec Mirelo, les étapes 3 à 5 se réduisent à un seul appel API. Le gain de temps se multiplie rapidement lorsque vous produisez en volume.
La route vers la musique IA
Mirelo a la génération de musique IA sur sa feuille de route. Le modèle d'effets sonores n'est que le début.
Imaginez générer une vidéo avec :
- Des visuels générés par IA
- Des dialogues générés par IA (ElevenLabs)
- Des effets sonores générés par IA (Mirelo)
- Une bande-son générée par IA (futur Mirelo)
Nous assemblons les pièces pour des médias entièrement synthétiques. Que cela vous enthousiasme ou vous terrifie dépend probablement de ce que vous créez pour vivre.
Tarification et accès
Pour les créateurs souhaitant essayer Mirelo :
- Niveau gratuit : Générations limitées pour tester la plateforme
- Forfait créateur : 20 €/mois (~23,50 $) pour un usage recommandé
- API : Paiement à l'usage via Fal.ai et Replicate
- Entreprise : Tarification personnalisée pour l'échelle
Le forfait créateur est étonnamment abordable compte tenu de la technologie. Comparez cela à l'embauche d'un bruiteur ou à la licence de bibliothèques sonores professionnelles.
Mon avis
Nous nous sommes tellement concentrés sur l'amélioration de l'apparence des vidéos IA que nous avons oublié que la vidéo est un médium multisensoriel. Mirelo corrige cette omission.
Essayez de télécharger l'une de vos vidéos générées par IA sur la plateforme Mirelo. La différence entre avant et après est la différence entre une démo et un livrable.
Les 41 millions de dollars de financement suggèrent que les investisseurs voient la même opportunité. L'audio n'est pas une fonctionnalité agréable à avoir—c'est la moitié de ce qui rend la vidéo captivante.
L'ère du cinéma muet s'est terminée en 1927 avec The Jazz Singer. Près d'un siècle plus tard, la vidéo IA vit son propre moment "parlant".
Mirelo parie qu'ils peuvent être le son de cette nouvelle ère. En se basant sur leur technologie, leur équipe et leur timing, ce pari semble de plus en plus judicieux.
Pour commencer
- Visitez mirelo.io pour explorer la plateforme
- Téléchargez une vidéo IA silencieuse
- Laissez Mirelo générer l'audio synchronisé
- Comparez avec votre travail audio manuel
- Décidez si l'automatisation est prête pour votre flux de travail
La barrière à l'entrée est faible. Les gains de temps potentiels sont élevés. Et la technologie ne fera que s'améliorer à mesure que ces 41 millions de dollars seront déployés.
Le son a enfin sa place à la table de la vidéo IA.
Cet article vous a-t-il été utile ?

Henry
Technologue CréatifTechnologue créatif de Lausanne explorant la rencontre entre l'IA et l'art. Expérimente avec des modèles génératifs entre ses sessions de musique électronique.
Articles connexes
Continuez à explorer avec ces articles similaires

Pika 2.5 : Démocratiser la Vidéo IA par la Rapidité, le Prix et les Outils Créatifs
Pika Labs dévoile la version 2.5, alliant génération accélérée, physique améliorée et outils créatifs tels que Pikaframes et Pikaffects pour rendre la vidéo IA accessible à tous.
Google entre sur le marché des avatars IA : Veo 3.1 alimente les nouveaux avatars dans Google Vids
Google améliore Vids avec des avatars alimentés par Veo 3.1, promettant aux utilisateurs d'entreprise cinq fois plus de préférence par rapport aux concurrents. Comment cela se compare-t-il à Synthesia et HeyGen ?

Runway Gen-4.5 Atteint le #1: Comment 100 Ingénieurs Ont Surpassé Google et OpenAI
Runway vient de revendiquer la première place sur Video Arena avec Gen-4.5, prouvant qu'une petite équipe peut surpasser des géants de mille milliards de dollars dans la génération vidéo par IA.