Mirelo lève 41 millions de dollars en Seed pour résoudre le problème des vidéos IA silencieuses

Par Trevor Loucks
Fondateur et Développeur Principal, Dynamoi
La vidéo générative a un problème de bruit : elle n'en produit aucun. Alors que des outils comme Sora et Kling peuvent créer des visuels hyperréalistes à partir de texte, les résultats restent bloqués à l'ère du cinéma muet.
Mardi, la startup berlinoise Mirelo a annoncé une levée de fonds Seed massive de 41 millions de dollars pour corriger ce goulot d'étranglement. L'accord, co-dirigé par Index Ventures et Andreessen Horowitz (a16z), n'est pas seulement une étape de financement. C'est un signal stratégique que le capital-risque se détourne de la génération vidéo pour se concentrer sur l'infrastructure nécessaire pour rendre cette vidéo utilisable.
La fin du silence
Le flux de travail actuel pour les créateurs de vidéos IA est fragmenté. Les utilisateurs génèrent des visuels dans un outil, puis parcourent les bibliothèques audio de stock pour trouver des effets sonores, synchronisant manuellement les bruits de pas ou les moteurs de voiture avec l'action. C'est une friction fastidieuse et coûteuse.
Mirelo vise à être la « couche audio » pour ce nouvel écosystème. En utilisant des modèles fondamentaux qui conditionnent la génération audio directement sur les pixels vidéo, la plateforme automatise le processus de synchronisation. Le PDG CJ Simon-Gabriel, ancien chercheur chez Amazon et musicien, résume le changement simplement : « La vidéo sans son a tellement moins de sentiment et d'atmosphère. »
Anatomie d'un méga-seed
Une levée de fonds Seed de 41 millions de dollars est une anomalie sur un marché où les chèques de stade précoce plafonnent généralement à 5 millions de dollars. Cette valorisation suggère que les investisseurs considèrent Mirelo non pas comme un simple outil, mais comme un monopole potentiel pour l'Internet génératif.
Les investisseurs :
- Leaders : Index Ventures et a16z.
- Anges stratégiques : Arthur Mensch (PDG de Mistral AI) et Antoine Le Nel (Revolut).
- Financement total : Environ 44 millions de dollars à ce jour.
La technologie :
Le produit principal, accessible via Mirelo Studio et une API, se concentre sur les Effets Sonores (SFX) et les Ambiances. Contrairement aux LLM qui prédisent du texte, les modèles de Mirelo prédisent des ondes sonores basées sur des entrées visuelles. L'entreprise affirme que son modèle Mirelo SFX v1.5 nécessite 50 fois moins de puissance de calcul que les systèmes de langage étendus typiques tout en offrant une synchronisation supérieure.
Le casse-tête réglementaire
Coïncidant avec l'annonce du financement, le gouvernement britannique a publié sa « Déclaration de progrès sur le droit d'auteur et l'IA » le 16 décembre 2025. Les conclusions présentent une complication significative pour le secteur.
L'Office britannique de la propriété intellectuelle a constaté que 95 % des répondants soutiennent la concession de licences pour les données d'entraînement plutôt que les exceptions au droit d'auteur. Cela crée un avenir binaire pour des entreprises comme Mirelo :
- La voie sous licence : Mirelo affirme utiliser des « bibliothèques sonores publiques et achetées » et signe des partenariats de partage des revenus. Si la provenance de leurs données est étanche, la réglementation devient un fossé qui les protège des concurrents opportunistes.
- La voie contentieuse : Si leur définition d'« intérêt légitime » n'est pas à la hauteur d'une licence complète, ils font face aux mêmes obstacles juridiques qui frappent actuellement Suno et Udio.
Idée clé : Dans un marché de l'IA réglementé, un jeu de données « propre » devient l'actif le plus précieux d'une entreprise — et sa barrière à l'entrée la plus élevée.
Pourquoi les bibliothèques sont nerveuses
Cette technologie représente une menace directe pour le bas de la marché de la synchronisation et les bibliothèques audio de stock. Les bibliothèques de musique de production comptent actuellement sur le volume — en vendant des abonnements à des créateurs qui ont besoin de sons génériques.
La perturbation : Si Mirelo peut générer un « whoosh cinématique » ou une « ambiance de bar bondé » parfaitement synchronisé pour un forfait mensuel fixe, la nécessité de rechercher dans les bibliothèques traditionnelles s'évapore. Les sociétés de stock audio doivent s'orienter immédiatement vers une curation humaine premium ou intégrer des outils IA similaires dans leur propre fonctionnalité de recherche pour survivre.
Ce que les détenteurs de droits devraient faire
Pour les labels et les éditeurs, l'essor de la « couche audio » offre une opportunité spécifique : la licence de stems et de catalogues d'effets sonores isolés. Comme l'indique le rapport britannique, les gouvernements penchent vers un modèle « payant » pour les données d'entraînement. Les détenteurs de droits disposant d'archives organisées et étiquetées de textures instrumentales et d'effets sonores détiennent les matières premières pour la prochaine génération de production vidéo.
À propos de l'éditeur

Trevor Loucks est le fondateur et développeur principal de Dynamoi, où il se concentre sur la convergence de la stratégie commerciale musicale et de la technologie publicitaire. Il s'attache à appliquer les dernières techniques de technologie publicitaire aux campagnes des artistes et des maisons de disques afin qu'elles augmentent la croissance des redevances musicales en aval.



