Mirelo sichert sich 41 Mio. USD Seed-Finanzierung, um das Problem stiller KI-Videos zu lösen

Von Trevor Loucks
Gründer & Leitender Entwickler, Dynamoi
Generative Videos haben ein Geräuschproblem: Sie erzeugen keines. Während Tools wie Sora und Kling hyperrealistische Bilder aus Text zaubern können, stecken die Ergebnisse noch im Stummfilmzeitalter fest.
Am Dienstag gab das in Berlin ansässige Startup Mirelo eine massive Seed-Runde in Höhe von 41 Millionen USD bekannt, um diesen Engpass zu beheben. Die Transaktion, die gemeinsam von Index Ventures und Andreessen Horowitz (a16z) geleitet wurde, ist nicht nur ein Finanzierungsmilestone. Sie ist ein strategisches Signal dafür, dass Risikokapital von der Videogenerierung hin zu der Infrastruktur umschwenkt, die dieses Video nutzbar macht.
Das Ende der Stille
Der aktuelle Workflow für KI-Videoproduzenten ist fragmentiert. Nutzer generieren Bilder in einem Tool und durchsuchen dann Stock-Audio-Bibliotheken nach Soundeffekten, wobei sie Schritte oder Auto-Geräusche manuell mit der Handlung synchronisieren. Das ist mühsame, teure Reibung.
Mirelo will die „Audio-Schicht“ für dieses neue Ökosystem sein. Durch die Verwendung von Foundation Models, die die Audiogenerierung direkt auf Video-Pixeln konditionieren, automatisiert die Plattform den Synchronisationsprozess. CEO CJ Simon-Gabriel, ein ehemaliger Amazon-Forscher und Musiker, fasst die Verschiebung einfach zusammen: „Video ohne Ton hat so viel weniger Gefühl und Atmosphäre.“
Anatomie eines Mega-Seed
Eine Seed-Runde von 41 Millionen USD ist ein Ausreißer in einem Markt, in dem Schecks in der Frühphase normalerweise 5 Millionen USD nicht übersteigen. Diese Bewertung legt nahe, dass Investoren Mirelo nicht als einfaches Tool, sondern als potenzielles Plattform-Monopol für das generative Internet betrachten.
Die Investoren:
- Leads: Index Ventures und a16z.
- Strategische Business Angels: Arthur Mensch (CEO von Mistral AI) und Antoine Le Nel (Revolut).
- Gesamtfinanzierung: Bisher rund 44 Millionen USD.
Die Technologie:
Das Kernprodukt, zugänglich über Mirelo Studio und eine API, konzentriert sich auf Soundeffekte (SFX) und Atmosphären. Im Gegensatz zu LLMs, die Text vorhersagen, sagen die Modelle von Mirelo Schallwellen basierend auf visuellen Eingaben voraus. Das Unternehmen behauptet, dass sein Modell Mirelo SFX v1.5 50-mal weniger Rechenleistung benötigt als typische große Sprachsysteme und dabei eine überlegene Synchronisation liefert.
Die regulatorische Hürde
Parallel zu den Finanzierungsnachrichten veröffentlichte die britische Regierung am 16. Dezember 2025 ihre „Copyright and AI Statement of Progress“. Die Ergebnisse stellen eine erhebliche Komplikation für den Sektor dar.
Das britische Amt für geistiges Eigentum (UK Intellectual Property Office) stellte fest, dass 95 % der Befragten die Lizenzierung von Trainingsdaten gegenüber Urheberrechtsausnahmen befürworten. Dies schafft eine binäre Zukunft für Unternehmen wie Mirelo:
- Der lizenzierte Weg: Mirelo gibt an, „öffentliche und erworbene Soundbibliotheken“ zu nutzen, und schließt Umsatzbeteiligungspartnerschaften ab. Wenn ihre Datenherkunft wasserdicht ist, werden Vorschriften zu einem Schutzwall gegen windige Konkurrenten.
- Der Rechtsweg: Wenn ihre Definition von „berechtigtem Interesse“ hinter einer vollständigen Lizenzierung zurückbleibt, sehen sie sich denselben rechtlichen Problemen gegenüber, die derzeit Suno und Udio belasten.
Wichtige Erkenntnis: In einem regulierten KI-Markt werden „saubere“ Datensätze zum wertvollsten Gut eines Unternehmens – und zu seiner höchsten Eintrittsbarriere.
Warum Bibliotheken nervös sind
Diese Technologie stellt eine direkte Bedrohung für den unteren Bereich des Synchronisationsmarktes und der Stock-Audio-Bibliotheken dar. Produktionsmusikbibliotheken sind derzeit auf Volumen angewiesen – sie verkaufen Abonnements an Kreative, die generische Sounds benötigen.
Die Disruption: Wenn Mirelo einen perfekt synchronisierten „filmischen Whoosh“ oder eine „Atmosphäre einer belebten Bar“ für eine monatliche Pauschale generieren kann, verschwindet die Notwendigkeit, traditionelle Bibliotheken zu durchsuchen. Stock-Audio-Unternehmen müssen sich sofort auf erstklassige menschliche Kuratierung umstellen oder ähnliche KI-Tools in ihre eigene Suchfunktionalität integrieren, um zu überleben.
Was Rechteinhaber tun sollten
Für Labels und Verlage bietet der Aufstieg der „Audio-Schicht“ eine spezifische Chance: die Lizenzierung von Stems und isolierten SFX-Katalogen. Wie der britische Bericht zeigt, neigen Regierungen zu einem „Pay-to-Play“-Modell für Trainingsdaten. Rechteinhaber mit organisierten, getaggten Archiven von instrumentalen Texturen und Soundeffekten sitzen auf den Rohmaterialien für die nächste Generation der Videoproduktion.
Über den Redakteur

Trevor Loucks ist der Gründer und leitende Entwickler von Dynamoi, wo er sich auf die Konvergenz von Musikgeschäftsstrategie und Werbetechnologie konzentriert. Er konzentriert sich darauf, die neuesten Ad-Tech-Techniken auf Kampagnen von Künstlern und Plattenlabels anzuwenden, damit diese das nachgelagerte Wachstum der Musiklizenzeinnahmen steigern.



