Spotifyが現在聴いている曲と音響的に似ている曲を見つける必要がある場合、タグやメタデータだけに頼ることはできません。生の音声そのものを分析します。\n\nこのガイドでは、Spotifyが音楽ファイルから音声特徴量をどのように抽出し、それらの特徴量が何を意味し、そしてそれらがあなたのトラックがアルゴリズムによるプレイリストのどこに表示されるかにどのように影響するかを解説します。\n\n## Spotifyにおける音声分析の仕組み\n\nディストリビューターを通じてトラックがSpotifyにアップロードされると、自動化された音声分析パイプラインを通過します。このシステムは生の波形を処理し、測定可能な数十の特徴量を抽出します。\n\n中核となる技術は、画像認識に使用されるのと同じ種類の機械学習モデルである畳み込みニューラルネットワーク(CNN)です。SpotifyのCNNはピクセルを分析する代わりに、時間の経過に伴う音の周波数の視覚的表現であるスペクトログラムを分析します。\n\nCNNはこれらのスペクトログラム内のパターンを検出するように学習します。力強いドラムビートやシンセサイザーはエレクトロニックまたはダンスミュージックを示唆します。穏やかなアコースティックギターのパターンはフォークやシンガーソングライターのジャンルを示唆します。複雑な和声構造はジャズやクラシックを示すかもしれません。\n\n## Spotifyが抽出する音声特徴量\n\nSpotifyのAPIは、すべてのトラックに対して13の音声特徴量を公開しています。これらはアルゴリズムが音響的な類似性を測定するために使用する構成要素です。\n\n### リズムとテンポの特徴量\n\n| Feature | Definition | 範囲 |\n| :--- | :--- | :--- |\n| tempo | 推定される1分あたりの拍数(BPM) | 0-250 |\n| time_signature | 1小節あたりの拍数(3/4、4/4など) | 1-7 |\n| danceability | テンポ、リズムの安定性、ビートの強さに基づく、ダンスへの適合性 | 0.0-1.0 |\n\nDanceabilityは単なるテンポではありません。120 BPMの不規則なリズムを持つトラックは、安定したグルーヴを持つ100 BPMのトラックよりもスコアが低くなります。\n\n### エネルギーと強度の特徴量\n\n| Feature | Definition | 範囲 |\n| :--- | :--- | :--- |\n| energy | 強度と活動性の知覚的な測定値 | 0.0-1.0 |\n| loudness | デシベル(dB)での全体的な音量 | -60 to 0 dB |\n\nEnergyは、ダイナミックレンジ、知覚される音量、音色、オンセットレート(新しい音が開始する頻度)、全体的なエントロピーなど、複数のシグナルを組み合わせます。デスメタルは高く評価され、バッハの前奏曲は低く評価されます。\n\n### 音調(トーン)の特徴量\n\n| Feature | Definition | 範囲 |\n| :--- | :--- | :--- |\n| key | トラックの音の中心 | 0-11 (C=0, C#=1など) |\n| mode | メジャー(1)またはマイナー(0) | 0 or 1 |\n\nこれらの特徴量は、ラジオや自動再生でのシームレスな移行のために、アルゴリズムが互換性のある和声構造を持つトラックをグループ化するのに役立ちます。\n\n### ムードと特徴の特徴量\n\n| Feature | Definition | 範囲 |\n| :--- | :--- | :--- |\n| valence | 音楽的なポジティブさ(ハッピーか悲しいか) | 0.0-1.0 |\n| acousticness | トラックがアコースティックであるという確信度 | 0.0-1.0 |\n| instrumentalness | トラックにボーカルがないという予測 | 0.0-1.0 |\n| speechiness | 話されている言葉の存在 | 0.0-1.0 |\n| liveness | トラックがライブで演奏された確率 | 0.0-1.0 |\n\nValenceはムードに基づいたおすすめにとって特に重要です。高ヴァレンス(0.8以上)のトラックは陽気または陶酔的に聞こえます。低ヴァレンス(0.2以下)のトラックは悲しい、憂鬱、または怒っているように聞こえます。\n\n## 音声特徴量がレコメンデーションに影響を与える方法\n\n音声分析はコールドスタート問題を解決します。新しいアーティストが最初のトラックをアップロードしたとき、リスニング履歴や協調フィルタリングデータがありません。しかし、音声特徴量はすぐに利用可能です。\n\nアルゴリズムの各サーフェスが音声分析をどのように使用するかを以下に示します。\n\n### ラジオと自動再生\n\nシードトラックに基づいてラジオがキューを生成するとき、音声の類似性が主要なシグナルとなります。アルゴリズムは以下の類似したトラックを見つけます。\n\n- テンポ(スムーズな移行のために合理的な範囲内)\n- エネルギーレベル(セッションの強度を維持するため)\n- キーとモード(和声的な互換性のために)\n- ヴァレンス(感情的なトーンを維持するため)\n\nこれが、高エネルギーのエレクトロニック・トラックからシードされたラジオステーションが、ジャンルタグを共有していても、スローなアコースティックバラードを突然挿入しない理由です。\n\n### ディスカバー・ウィークリー\n\nDiscover Weeklyは主に協調フィルタリングを使用しますが、音声分析はタイブレーク(決定打)として機能します。複数の候補トラックが類似したリスニング重複スコアを持っている場合、アルゴリズムは既存の好みプロファイルに音声特徴量が最も近いものを優先します。\n\n## アーティストが音声特徴量から学べること\n\nSpotifyがオーディオをどのように分析するかを直接制御することはできませんが、これらの特徴量を理解することで、アルゴリズムがあなたの音楽をどのように認識しているかを解釈するのに役立ちます。\n\n### トラックの音声特徴量の確認\n\n
Tip \nサードパーティのツールを使用すると、SpotifyのAPIからトラックの音声特徴量を抽出できます。SpotifyのトラックURLを入力して特徴量の値が返されるサービスを探してください。\n \n\n注目すべき点:\n\n- カタログ全体での一貫した特徴量は、アルゴリズムがあなたの音楽をクラスター化するのに役立ちます。エネルギー、テンポ、ヴァレンスが大きく異なると、アルゴリズムは誰がそれを楽しむかを予測するのが難しくなります。\n- ターゲットオーディエンスに一致する特徴量は、ラジオでの配置を改善します。あなたのサウンドが高エネルギーでダンスに適している場合、あなたのトラックはワークアウトやパーティー向けのラジオセッションに表示されやすくなります。\n\n### イントロ問題\n\n音声分析はトラック全体を調べますが、リスナーの行動は最初の30秒に大きく影響されます。もしあなたのイントロが曲の残りの部分とは異なる特性を持っている場合(大きなドロップの前の静かなアンビエントなイントロなど)、音声特徴量はリスナーが最初に体験することと一致しない可能性があります。\n\nこれによりミスマッチが生じる可能性があります。アルゴリズムは全体のエネルギーに基づいてあなたのトラックをおすすめしますが、リスナーはイントロが期待と合わないためスキップします。イントロの最適化は、全体の音声プロファイルを最適化するのとは別のスキルです。\n\n## 音声分析の限界\n\n音声分析は強力ですが、盲点があります。\n\n文化的文脈が欠けている。 アルゴリズムはあなたのトラックに高いエネルギーと128 BPMのテンポがあることは知っていますが、その歌詞が特定の文化的瞬間を参照していることや、そのプロダクションスタイルが特定の時代を呼び起こすことは知りません。\n\n似た音響=似たオーディエンスではない。 2つのトラックがほぼ同一の音声特徴量を持っていても、全く異なるリスナーにアピールする可能性があります。音声分析は音響的な隣人を見つけますが、オーディエンスの隣人を見つけるわけではありません。\n\nジャンルは推測され、宣言されない。 Spotifyはディストリビューターから提供されたジャンルタグを使用しますが、音響特性が一致しない場合、音声分析がそれらを上書きすることがあります。アコースティックフォークのように聞こえる「ヒップホップ」としてタグ付けされたトラックは、代わりにフォークのリスナーにおすすめされる可能性があります。\n\n## より広範なアルゴリズムにおける音声の役割\n\n音声分析は、Spotifyのアルゴリズムが使用する3つの主要なデータソースの1つです。\n\n| Data source | What it captures | Best for |\n| :--- | :--- | :--- |\n| Collaborative filtering | ユーザー間のリスニングパターン | オーディエンスの重複を見つける |\n| Natural language processing | 歌詞、プレイリストのタイトル、ウェブ上の言及 | 文化的文脈を理解する |\n| Audio analysis | 波形の音響特性 | 音響的に類似したトラックを見つける |\n\n確立されたアーティストの場合、協調フィルタリングが優勢です。新しいアーティストの場合、分析するリスニング履歴がないため、音声分析の比重が高くなります。\n\n目標は、明確で一貫した音声特性を持つ音楽をリリースしつつ、熱心なリスナーベースを構築することです。音声分析はあなたを発見させ、エンゲージメントのシグナルがおすすめされ続けるかどうかを決定します。