BaRT는 Bandits for Recommendations as Treatments의 약자입니다. 이는 Spotify 사용자의 홈 화면에 표시되는 항목, 재생 목록 순서, 해당 재생 목록 내의 노래, 추천과 함께 제공되는 설명 텍스트를 제어하는 AI 시스템입니다.
이 이름은 '다중 무장 밴딧(multi-armed bandits)'이라는 머신러닝 기술에서 유래했으며, 이는 알고리즘이 익숙한 음악으로 안전하게 갈지 아니면 새로운 것을 소개할지 결정하는 데 도움을 줍니다.
BaRT가 홈 화면을 구성하는 방법
Spotify의 홈 화면은 '나만을 위한 음악' 또는 '최근 청취 기록에서 영감을 얻음'과 같은 '선반(shelves)'이라고 불리는 재생 목록 행으로 구성되며, 해당 선반 내의 개별 재생 목록은 '카드(cards)'라고 불립니다.
BaRT에는 두 가지 임무가 있습니다.
- 각 선반 내 카드 순위 지정 - 어떤 재생 목록이 먼저 나타날지 결정
- 선반 자체 순위 지정 - 화면 상단에 어떤 콘텐츠 행이 나타날지 결정
이 순위 지정은 청취 기록, 시간, 이전 추천에 대한 응답을 기반으로 실시간으로 개인화됩니다.
BaRT는 탐색 대 활용의 균형을 어떻게 맞출까요?
BaRT는 끊임없이 두 가지 모드 사이의 균형을 맞춥니다.
활용(Exploitation) 모드는 시스템이 좋아할 것이라고 확신하는 콘텐츠를 추천합니다. 이는 청취 기록, 저장된 노래, 건너뛴 트랙 및 재생 목록 활동을 활용하여 스트리밍을 유지할 것으로 예측합니다.
탐색(Exploration) 모드는 시스템이 확신하지 못하는 콘텐츠를 추천합니다. 이는 두 가지 목적을 수행합니다. Spotify가 사용자의 선호도에 대해 더 많이 학습하도록 돕고, 그렇지 않으면 찾지 못했을 수도 있는 음악을 소개합니다.
이 모드 간의 균형은 '엡실론-그리디(epsilon-greedy)' 전략을 통해 관리됩니다. 대부분의 경우 BaRT는 사용자에 대해 알고 있는 것을 활용합니다. 때때로 새로운 정보를 수집하기 위해 탐색합니다.
청취 기록이 거의 없는 신규 사용자의 경우 BaRT는 탐색에 더 중점을 둡니다. 확립된 선호도를 가진 장기 사용자의 경우 활용 쪽으로 더 기울어집니다.
30초 성공 신호란 무엇인가요?
BaRT는 간단한 임계값을 사용하여 자체 성능을 측정합니다. 청취자가 추천된 트랙을 30초 이상 스트리밍하면 해당 추천은 성공으로 간주됩니다.
누군가가 추천된 재생 목록이나 라디오 세션을 더 오래 들을수록 BaRT는 해당 사용자에 대한 예측에 대한 확신을 더 얻게 됩니다. 이것이 바로 초기 건너뛰기가 알고리즘 도달 범위에 해로운 이유입니다. 이는 BaRT에 추천이 실패했음을 알려주기 때문입니다.
BaRT가 사용하는 세 가지 데이터 소스는 무엇인가요?
BaRT는 단독으로 작동하지 않습니다. 세 가지 주요 데이터 파이프라인을 활용합니다.
| 데이터 소스 | 캡처하는 내용 | 도움이 되는 방식 |
|---|---|---|
| 협업 필터링 | 유사한 청취자가 즐기는 패턴 | '아티스트 X의 팬은 아티스트 Y도 좋아함' |
| 오디오 분석 | 템포, 키, 음색, 음질 | 라디오를 위해 음향적으로 유사한 트랙 찾기 |
| 자연어 처리 | 가사, 재생 목록 제목, 블로그 언급 | 분위기 및 장르 맥락 이해 |
이러한 신호가 BaRT로 유입되며, BaRT는 개별 사용자에게 이러한 신호를 어떻게 가중치를 부여할지 결정합니다.
아티스트에게 의미하는 바
BaRT는 피칭할 수 있는 게이트키퍼가 아닙니다. 이는 청취자 행동에서 학습하는 예측 엔진입니다.
높은 saves와 낮은 건너뛰기는 귀하의 음악이 추천된 청취자들을 만족시켰음을 BaRT에 알려줍니다. 이는 향후 추천 가능성을 높입니다.
높은 건너뛰기와 낮은 saves는 추천이 맞지 않았음을 BaRT에 알려줍니다. 시스템은 유사한 청취자에게 귀하의 트랙을 보여줄 가능성이 낮아집니다.
BaRT에 영향을 미치는 유일한 방법은 진정한 청취자 참여를 통해 긍정적인 신호를 보내는 것입니다. 이는 단순히 스트리밍 횟수가 아닌 저장 비율, 완료율 및 반복 청취를 최적화하는 것을 의미합니다.
BaRT는 Spotify의 다른 시스템과 어떻게 비교되나요?
BaRT는 특히 홈 화면과 개인화된 선반 추천을 처리합니다. 다른 알고리즘 표면에는 자체 논리가 있습니다.
- Discover Weekly는 협업 필터링을 사용하여 매주 월요일에 새로 고침됩니다.
- Release Radar는 매주 금요일에 업데이트되며 팔로우하는 아티스트를 우선시합니다.
- 라디오 및 자동 재생은 오디오 유사성 및 세션 지속 신호를 사용합니다.
이러한 시스템은 데이터를 공유하지만 독립적으로 작동합니다. BaRT의 홈 추천에서 잘 작동하는 트랙이 라디오에서도 선택될 수 있지만 보장된 교차 적용은 없습니다.
BaRT의 기반이 되는 연구는 무엇인가요?
기초 연구는 2018년 Spotify 엔지니어들이 'Explore, Exploit, Explain: Personalizing Explainable Recommendations with Bandits'라는 제목으로 발표했습니다. 이 논문은 BaRT가 항목, 설명 및 컨텍스트의 모든 조합에 대한 사용자 만족도를 예측하는 방법을 학습하는 방법을 설명합니다.
그 이후로 Spotify는 이 접근 방식을 계속해서 개선해 왔습니다. 2025년 연구 논문에서는 사용자의 진화하는 선호도에 실시간으로 적응하면서 추천 목록 내에서 콘텐츠 유형(음악, 팟캐스트, 오디오북)을 보정하기 위해 컨텍스트 밴딧을 사용하는 방법을 설명합니다.