Spotify 알고리즘 용어: BaRT, 저장률 및 기타

Spotify 추천 엔진의 기술 용어 참고 가이드입니다. BaRT, 협업 필터링, 오디오 기능 및 참여 측정항목을 다룹니다.

FAQ
5 min read
A detailed scientific illustration depicting the inner workings of the Spotify 알고리즘 as a complex, elegant machine.

이 용어집은 Spotify 추천 시스템이 작동하는 방식을 설명하는 데 사용되는 기술 용어를 정의합니다. 알고리즘 기반 플레이리스트, 참여 최적화 또는 플랫폼 전략에 대해 읽을 때 참조 자료로 사용하십시오.


핵심 시스템

BaRT (Bandits for Recommendations as Treatments)

Spotify 홈 화면 추천을 관리하는 AI 시스템입니다. BaRT는 활용(exploitation)(사용자가 좋아하는 콘텐츠 표시)과 탐색(exploration)(사용자 선호도에 대해 자세히 알아보기 위해 새 콘텐츠 테스트)의 균형을 맞추기 위해 다중 슬롯 머신 접근 방식을 사용합니다. 전체 설명 보기 →

협업 필터링

유사한 청취자가 좋아하는 콘텐츠에서 패턴을 식별하는 추천 기술입니다. 내 트랙을 저장한 청취자가 B 트랙도 저장하는 경우, 알고리즘은 새 청취자에게 B 트랙을 추천할 가능성이 더 높습니다. 이는 '팬들이 좋아할 만한 다른 아티스트' 연관 항목 및 Discover Weekly의 많은 부분을 지원합니다. 전체 설명 보기 →

오디오 분석

트랙의 원시 오디오 파형에서 측정 가능한 특징을 추출하는 프로세스입니다. Spotify는 컨볼루션 신경망(CNN)을 사용하여 스펙트로그램을 분석하고 템포, 키, 에너지, 분위기와 같은 특성을 감지합니다. 이를 통해 Radio 및 Autoplay를 위한 음향 유사성 추천이 가능해집니다. 전체 설명 보기 →

자연어 처리(NLP)

알고리즘이 텍스트 맥락을 이해하는 능력입니다. Spotify의 NLP 구성 요소는 플레이리스트 제목, 노래 가사, 블로그 언급 및 소셜 미디어 토론을 분석하여 음악 주변의 문화적 맥락을 이해합니다.


참여 측정항목

저장률

트랙을 보관함에 저장한 청취자의 비율입니다. 저장 횟수 ÷ 고유 청취자 수로 계산됩니다. 높은 저장률은 강력한 청취자 의도를 나타내며 알고리즘 성공의 가장 중요한 예측 변수 중 하나입니다. 전체 설명 보기 →

건너뛰기율

청취자가 특정 임계값(종종 30초 표시) 이전에 건너뛰는 스트림의 비율입니다. 초반 건너뛰기율이 높으면 해당 트랙이 노출된 잠재 고객에게 적합하지 않다는 신호를 알고리즘에 보냅니다.

완주율

트랙을 처음부터 끝까지 재생하는 청취자의 비율입니다. 높은 완주율은 강력한 유지율을 나타내며 알고리즘 점수에 긍정적으로 기여합니다.

반복 재생률

개별 청취자가 동일한 트랙을 여러 번 재생하기 위해 돌아오는 빈도입니다. 높은 반복률은 깊은 참여를 나타내며 '슈퍼 리스너' 분류를 유발할 수 있습니다.

스트림 대 청취자 비율

기간 동안 고유 청취자당 평균 스트림 수입니다. 비율이 1.0을 초과하면 반복 청취가 이루어지고 있음을 나타냅니다. 비율이 높을수록 일회성 캐주얼 재생보다는 열성적인 팬을 시사합니다.


오디오 기능

템포

분당 비트(BPM)로 측정되는 트랙의 속도입니다. 0-250 BPM 범위입니다.

에너지

강도와 활동성을 나타내는 0.0-1.0 측정값입니다. 동적 범위, 인식된 음량, 음색, 온셋 속도 및 엔트로피를 결합합니다. 데스 메탈은 높게 측정되고 앰비언트 음악은 낮게 측정됩니다.

발렌스

음악적 긍정성을 나타내는 0.0-1.0 측정값입니다. 높은 발렌스(0.8+)는 행복하거나 고양된 느낌을 줍니다. 낮은 발렌스(0.2 이하)는 슬프거나, 우울하거나, 화난 느낌을 줍니다.

댄스 가능성

템포, 리듬 안정성, 비트 강도 및 규칙성을 기반으로 트랙이 춤추기에 얼마나 적합한지를 나타내는 0.0-1.0 점수입니다.

어쿠스틱성

트랙이 어쿠스틱인지에 대한 0.0-1.0 신뢰도 측정값입니다. 1.0은 트랙에 전자 또는 증폭된 악기가 포함되어 있지 않다는 높은 확신을 나타냅니다.

기악성

트랙에 보컬이 포함되어 있는지에 대한 0.0-1.0 예측입니다. 0.5를 초과하는 값은 기악 트랙임을 시사합니다. "우" 및 "아" 소리는 기악으로 처리됩니다.

스피치성

구어체 콘텐츠의 존재 여부를 나타내는 0.0-1.0 측정값입니다. 팟캐스트 스타일 콘텐츠는 높게 측정되고 순수 기악 음악은 낮게 측정됩니다.


알고리즘 노출 영역

Discover Weekly

매주 월요일에 새로 고침되는, 청취자가 이전에 듣지 못한 30곡으로 구성된 개인화된 플레이리스트입니다. 주로 협업 필터링으로 구동됩니다. 전체 설명 보기 →

Release Radar

매주 금요일에 새로 고침되는, 팔로우하는 아티스트 및 유사 아티스트의 신곡으로 구성된 개인화된 플레이리스트입니다. 발매일 최소 7일 전에 Spotify for Artists를 통해 피칭해야 합니다.

Radio

시드 곡 또는 아티스트와 유사한 트랙으로 자동 생성되는 대기열입니다. 음향 유사성을 위한 오디오 분석과 잠재 고객 중복을 위한 협업 필터링을 사용합니다.

Autoplay

플레이리스트나 앨범이 끝날 때 음악 재생을 계속하는 기능입니다. Radio와 동일한 신호를 사용하여 청취 세션을 무기한 연장합니다.

Daily Mix

저장된 음악과 유사한 트랙을 장르 또는 분위기별로 그룹화한 4~6개의 플레이리스트 세트입니다. 매일 업데이트됩니다.

AI DJ

합성 음성 해설이 포함된 개인화된 라디오 경험입니다. 다른 노출 영역과 동일한 개인화 엔진을 사용하지만 아티스트 및 트랙에 대한 음성 맥락을 추가합니다. 전체 설명 보기 →


프로모션 도구

Discovery Mode

아티스트가 Radio, Autoplay 및 Mix에서 발생하는 스트리밍 수익의 30%를 수수료로 받는 로열티 공유 방식입니다. 대신 추천 가능성이 높아집니다. 전체 설명 보기 →

Marquee

대상 청취자가 모바일 앱을 열 때 표시되는 신곡(발매 후 21일 이내)에 대한 전체 화면 팝업 광고입니다. Campaign Kit의 일부이며 클릭당 비용으로 가격이 책정됩니다.

Showcase

모든 발매물에 대해 Spotify 홈 피드에 표시되는 배너 광고입니다. Campaign Kit의 일부이며 클릭당 비용으로 가격이 책정됩니다. 전체 설명 보기 →

Canvas

모바일에서 트랙 재생 시 뒤에 표시되는 3-8초 길이의 루핑 비디오입니다. 직접적인 알고리즘 요소는 아니지만 청취자가 시청하고 저장하도록 유도하여 참여 측정항목을 개선할 수 있습니다.


기술적 개념

탐색 대 활용

BaRT가 좋아하는 콘텐츠를 보여주는 것(활용)과 선호도를 학습하기 위해 새 콘텐츠를 테스트하는 것(탐색) 사이에서 관리하는 상충 관계입니다. 새 사용자는 탐색을 더 많이 하고, 기존 사용자는 활용을 더 많이 합니다.

콜드 스타트 문제

청취 기록이 없는 신인 아티스트나 신규 사용자를 위해 음악을 추천하는 어려움입니다. 오디오 분석은 동작 데이터 없이도 음향 유사성 추천을 가능하게 하여 이 문제를 해결하는 데 도움이 됩니다.

엡실론-그리디 전략

BaRT가 탐색과 활용의 균형을 맞추는 데 사용하는 구체적인 알고리즘입니다. 대부분의 시간에는 활용(높은 확신의 추천 표시)을 하고, 가끔 탐색(데이터 수집을 위해 불확실한 추천 표시)을 합니다.

문맥적 머신러닝(Contextual bandit)

맥락에 따라 최적의 조치를 학습하는 머신러닝 프레임워크입니다. BaRT는 추천 시 사용자 맥락(시간, 기기, 최근 활동)을 고려하는 문맥적 머신러닝 시스템입니다.

스펙트로그램

시간에 따른 사운드 주파수의 시각적 표현입니다. Spotify의 CNN은 스펙트로그램을 분석하여 원시 파형에서 오디오 특징을 추출합니다.

마이크로 장르

개인화를 위해 사용되는 세분화된 하위 장르 분류입니다. Spotify는 청취 패턴과 오디오 특성을 기반으로 광범위한 마이크로 장르 분류 체계를 유지합니다.


청취자 세그먼트

활성 청취자

지난 28일 이내에 능동적인 소스(아티스트 프로필, 발매 페이지, 개인 플레이리스트, 검색)에서 의도적으로 내 음악을 찾아 들은 청취자입니다.

월간 활성 청취자

수동적인 플레이리스트 재생이나 Radio 노출이 아닌, 의도적으로 능동적인 소스에서 스트리밍한 월간 청취자 하위 집합입니다.

프로그램된 청취자

알고리즘 또는 편집자가 선정한 플레이리스트를 통해 내 음악을 들었지만 의도적으로 찾아 듣지는 않은 청취자입니다.


플랫폼 개념

30초 규칙

스트림이 로열티 및 참여 측정항목에 포함되려면 청취자가 해당 트랙을 30초 이상 재생해야 합니다. 30초 이전에 건너뛰면 수익이 발생하지 않으며 부정적인 신호를 보냅니다. 전체 설명 보기 →

1,000회 스트림 임계값

2024년 기준으로 트랙이 로열티를 생성하려면 12개월 동안 1,000회의 스트림을 축적해야 합니다. 이 임계값 미만의 스트림은 지급되지 않습니다.

인기 지수

Spotify가 각 트랙과 아티스트에게 최근 스트리밍 속도를 기준으로 할당하는 0-100 점수입니다. 점수가 높을수록 플랫폼 평균 대비 성장 속도가 빠름을 나타냅니다. 전체 설명 보기 →

취향 프로필

청취 기록, 저장, 건너뛰기 및 플레이리스트 활동을 기반으로 Spotify가 각 사용자를 위해 구축하는 알고리즘 모델입니다. 모든 개인화된 추천의 기반이 됩니다.