Spotifyアルゴリズム用語集:BaRT、保存率など

Spotifyのレコメンデーションエンジンを支える技術用語のリファレンスガイド。BaRT、協調フィルタリング、オーディオ機能、エンゲージメント指標を網羅。

FAQ
1 min read
A detailed scientific illustration depicting the inner workings of the Spotifyアルゴリズム as a complex, elegant machine.

この用語集は、Spotifyのレコメンデーションシステムがどのように機能するかを説明するために使用される技術用語を定義します。アルゴリズムプレイリスト、エンゲージメントの最適化、またはプラットフォーム戦略について読む際の参照としてご活用ください。


コアシステム

BaRT(Bandits for Recommendations as Treatments)

Spotifyのホーム画面のレコメンデーションを司るAIシステム。BaRTは、搾取(ユーザーが好きなコンテンツを表示すること)と探索(新しいコンテンツをテストして好みを学習すること)のバランスを取るために、多腕バンディットアプローチを使用します。詳しい解説 →

協調フィルタリング

似たリスナーの嗜好パターンを特定するレコメンデーション手法。あなたのトラックを保存したリスナーがトラックBも保存した場合、アルゴリズムは新しいリスナーにトラックBを推薦する可能性が高くなります。これは「ファンは他にこんなアーティストも聴いています」の関連付けや、ディスカバーウィークリーの多くを支えています。詳しい解説 →

音声分析

トラックの生オーディオ波形から測定可能な特徴を抽出するプロセス。Spotifyは畳み込みニューラルネットワーク(CNN)を使用してスペクトログラムを分析し、テンポ、キー、エネルギー、ムードなどの特性を検出します。これにより、ラジオやオートプレイのための音響的類似性レコメンデーションが可能になります。詳しい解説 →

自然言語処理(NLP)

アルゴリズムがテキストの文脈を理解する能力。SpotifyのNLPコンポーネントは、プレイリストのタイトル、歌詞、ブログの言及、ソーシャルメディアでの議論を分析し、音楽に関する文化的文脈を理解します。


エンゲージメント指標

保存率

トラックをライブラリに保存したリスナーの割合。saves ÷ unique listenersで計算されます。高い保存率は強力なリスナーの意図を示し、アルゴリズム的な成功の最も重要な予測因子の一つです。詳しい解説 →

スキップ率

リスナーが特定のしきい値(多くの場合30秒)より前にスキップしたストリームの割合。早期のスキップ率が高いと、そのトラックが提示されたオーディエンスにとって不適切であったことをアルゴリズムに学習させます。

再生完了率

トラックを最初から最後まで再生したリスナーの割合。高い再生完了率は強力なリテンションを示し、アルゴリズムスコアにプラスに貢献します。

リピート再生率

個々のリスナーが同じトラックを繰り返し再生する頻度。高いリピート率は深いエンゲージメントを示し、「スーパーリスナー」分類をトリガーする可能性があります。

ストリーム/リスナー比率

一定期間におけるユニークリスナーあたりの平均ストリーム数。1.0を超える比率はリピートリスニングを示唆します。高い比率は、一度限りのカジュアルな再生ではなく、熱心なファンがいることを示します。


オーディオ機能

テンポ

BPM(Beats Per Minute)で測定されるトラックの速さ。0〜250 BPMの範囲。

エネルギー

強度と活動性の0.0〜1.0の尺度。ダイナミックレンジ、知覚されるラウドネス、音色、オンセット率、エントロピーを組み合わせます。デスメタルは高く、アンビエントミュージックは低くなります。

バレンス

音楽的なポジティブさの0.0〜1.0の尺度。高いバレンス(0.8以上)はハッピーまたは陶酔的な響きです。低いバレンス(0.2以下)は悲しい、メランコリック、または怒っている響きです。

ダンスしやすさ

テンポ、リズムの安定性、ビートの強さ、規則性に基づいて、トラックがダンスに適しているかの0.0〜1.0のスコア。

アコースティックネス

トラックがアコースティックであるかどうかの0.0〜1.0の信頼度尺度。1.0の値は、トラックに電子楽器や増幅された楽器が含まれていない可能性が高いことを示します。

インストゥルメンタルネス

トラックにボーカルが含まれているかどうかの0.0〜1.0の予測。0.5を超える値はインストゥルメンタルトラックを示唆します。「オー」や「アー」といった音はインストゥルメンタルとして扱われます。

スピーチネス

口頭での言葉の存在量の0.0〜1.0の尺度。ポッドキャスト形式のコンテンツは高く、純粋なインストゥルメンタルミュージックは低くなります。


アルゴリズム上の表示面

ディスカバーウィークリー

リスナーがまだ聴いたことのない30曲のパーソナライズされたプレイリストで、毎週月曜日に更新されます。主に協調フィルタリングによって駆動されます。詳しい解説 →

リリースレーダー

フォローしているアーティストや類似アーティストの新しいリリースのパーソナライズされたプレイリストで、毎週金曜日に更新されます。リリース日の少なくとも7日前にSpotify for Artistsを通じてピッチングする必要があります。

ラジオ

シードとなる曲やアーティストに似たトラックの自動生成されたキュー。音響的類似性のための音声分析と、オーディエンスの重複のための協調フィルタリングを使用します。

オートプレイ

プレイリストやアルバムが終了したときに再生を継続する機能。ラジオと同じシグナルを利用して、リスニングセッションを無期限に延長します。

デイリーミックス

保存した音楽と似たトラックをジャンルまたはムードごとにグループ化した4〜6個のプレイリストセット。毎日更新されます。

AI DJ

合成された音声の解説付きのパーソナライズされたラジオ体験。他の表示面と同じパーソナライゼーションエンジンを使用しますが、アーティストやトラックに関する口頭でのコンテキストが追加されます。詳しい解説 →


プロモーションツール

ディスカバリーモード

ラジオ、オートプレイ、ミックスからのストリームに対するロイヤリティの30%を手数料として受け入れる代わりに、レコメンデーションの可能性を高めるロイヤリティ共有アレンジメント。詳しい解説 →

マーキー

ターゲットリスナーがモバイルアプリを開いたときに表示される、新しいリリース(21日以内)のためのフルスクリーンのポップアップ広告。Campaign Kitの一部であり、クリック課金制です。

ショーケース

任意のリリースを対象としたSpotifyのホームフィード上のバナー広告。Campaign Kitの一部であり、クリック課金制です。詳しい解説 →

キャンバス

モバイルでトラック再生中に裏側に表示される、ループする3〜8秒のビデオ。直接アルゴリズム的ではありませんが、リスナーが視聴して保存することを促すことでエンゲージメント指標を向上させることができます。


技術的概念

探索と搾取

BaRTが管理する、好きなコンテンツを表示すること(搾取)と、好みを学習するために新しいコンテンツをテストすること(探索)のトレードオフ。新しいユーザーはより多くの探索を受け、確立されたユーザーはより多くの搾取を受けます。

コールドスタート問題

リスニング履歴のない新しいアーティストや新しいユーザーのための音楽推薦の課題。音声分析は、行動データなしで音響的類似性のレコメンデーションを可能にすることで、これを解決するのに役立ちます。

イプシロン・グリーディ戦略

BaRTが探索と搾取のバランスを取るために使用する具体的なアルゴリズム。ほとんどの場合、搾取(高い確信度のレコメンデーションを表示)し、時折探索(データを収集するために不確実なレコメンデーションを表示)します。

コンテクスチュアルバンディット

コンテキストに基づいて最適なアクションを学習する機械学習フレームワーク。BaRTはコンテクスチュアルバンディットシステムであり、レコメンデーションを行う際にユーザーのコンテキスト(時刻、デバイス、最近のアクティビティ)を考慮に入れます。

スペクトログラム

時間の経過に伴う音の周波数の視覚的表現。SpotifyのCNNはスペクトログラムを分析して、生波形からオーディオ特徴を抽出します。

マイクロジャンル

パーソナライゼーションに使用されるきめ細かなサブジャンル分類。Spotifyはリスニングパターンとオーディオ特性に基づいて多数のマイクロジャンル分類法を維持しています。


リスナーセグメント

アクティブリスナー

過去28日間に、アクティブなソース(アーティストプロフィール、リリースページ、個人プレイリスト、検索)から意図的にあなたの音楽を聴いたリスナー。

月間アクティブリスナー

月間リスナーのうち、受動的なプレイリストやラジオでの露出ではなく、意図的にアクティブなソースからストリーミングしたサブセット。

プログラムされたリスナー

アルゴリズムまたはエディトリアルプレイリストを通じてあなたの音楽を聴いたが、意図的にあなたを探さなかったリスナー。


プラットフォームの概念

30秒ルール

ストリームがロイヤリティとエンゲージメント指標にカウントされるには、リスナーがそのトラックを30秒以上再生する必要があります。30秒未満のスキップは収益を生まず、ネガティブなシグナルを送ります。詳しい解説 →

1,000ストリームのしきい値

2024年現在、ロイヤリティを発生させるには、トラックが過去12か月間に1,000ストリームを蓄積する必要があります。このしきい値を下回るストリームは支払いが行われません。

人気度インデックス

Spotifyが各トラックとアーティストに割り当てる0〜100のスコアで、最近のストリーミング速度に基づいています。スコアが高いほど、プラットフォーム平均と比較して成長が速いことを示します。詳しい解説 →

テイストプロファイル

リスニング履歴、保存、スキップ、プレイリストのアクティビティに基づいてSpotifyが各ユーザーのために構築するアルゴリズムモデル。すべてのパーソナライズされたレコメンデーションの基盤となります。