BaRT steht für Bandits for Recommendations as Treatments (Banditen für Empfehlungen als Behandlungen). Es ist das KI-System, das steuert, was auf dem Home-Bildschirm eines Spotify-Nutzers erscheint, einschließlich der Reihenfolge der Playlists, der Songs innerhalb dieser Playlists und des erklärenden Textes, der Empfehlungen begleitet.
Der Name leitet sich von einer Machine-Learning-Technik namens „Multi-Armed Bandits“ ab, die dem Algorithmus hilft zu entscheiden, wann er mit vertrauter Musik auf Nummer sicher gehen oder wann er etwas Neues einführen soll.
Wie BaRT den Home-Bildschirm organisiert
Der Home-Bildschirm von Spotify ist in Reihen von Playlists, sogenannte „Shelves“ (Regale, z. B. „Für dich erstellt“ oder „Inspiriert von deinem letzten Hören“), strukturiert, wobei einzelne Playlists innerhalb dieser Regale als „Cards“ (Karten) bezeichnet werden.
BaRT hat zwei Aufgaben:
- Die Karten innerhalb jedes Regals einstufen – entscheiden, welche Playlists zuerst erscheinen
- Die Regale selbst einstufen – entscheiden, welche Inhaltsreihen ganz oben auf dem Bildschirm erscheinen
Diese Einstufung erfolgt in Echtzeit personalisiert, basierend auf Ihrer Hörhistorie, der Tageszeit und wie Sie auf frühere Empfehlungen reagiert haben.
Exploration vs. Exploitation (Erkundung vs. Ausbeutung)
BaRT gleicht ständig zwei Modi ab:
Exploitation-Modus (Ausbeutung) empfiehlt Inhalte, von denen das System überzeugt ist, dass sie Ihnen gefallen werden. Er stützt sich auf Ihre Hörhistorie, gespeicherte Songs, übersprungene Titel und Playlist-Aktivitäten, um vorherzusagen, was Sie zum Weiterstreamen animiert.
Exploration-Modus (Erkundung) empfiehlt Inhalte, bei denen das System unsicher ist. Dies dient zwei Zwecken: Es hilft Spotify, mehr über Ihre Vorlieben zu erfahren, und es macht Sie mit Musik bekannt, die Sie sonst vielleicht nicht gefunden hätten.
Das Gleichgewicht zwischen diesen Modi wird durch eine „Epsilon-Greedy“-Strategie gesteuert. Meistens nutzt BaRT das, was es über Sie weiß (Exploitation). Gelegentlich erkundet es, um neue Informationen zu sammeln.
Bei neuen Nutzern mit wenig Hörhistorie neigt BaRT stärker zur Exploration. Bei langjährigen Nutzern mit etablierten Vorlieben neigt es stärker zur Exploitation.
Das 30-Sekunden-Erfolgssignal
BaRT misst seine eigene Leistung anhand eines einfachen Schwellenwerts: Wenn ein Hörer einen empfohlenen Titel länger als 30 Sekunden streamt, gilt die Empfehlung als erfolgreich.
Je länger jemand eine empfohlene Playlist oder Radiosession hört, desto mehr Vertrauen gewinnt BaRT in seine Vorhersagen für diesen Nutzer. Deshalb schaden frühe Sprünge Ihrer algorithmischen Reichweite – sie lehren BaRT, dass die Empfehlung fehlgeschlagen ist.
Drei Datenquellen, die BaRT nutzt
BaRT arbeitet nicht allein. Es greift auf drei Hauptdatenpipelines zurück:
| Datenquelle | Was sie erfasst | Wie sie hilft |
|---|---|---|
| Kollaboratives Filtern | Muster dessen, was ähnliche Hörer mögen | „Fans von Künstler X mögen auch Künstler Y“ |
| Audioanalyse | Tempo, Tonart, Energie, Klangfarbe | Findet klanglich ähnliche Titel für Radio |
