スピアマンの相関係数:定義
スピアマンの順位相関係数は、順位相関のノンパラメトリック尺度です(2つの変数間の順位の統計的依存性)。
チャールズ・スピアマンにちなんで名付けられ、ギリシャ文字の「ρ」(ロー)で表されることが多く、主にデータ分析に使用されます。
これは、2つのランク付けされた変数間の関連の強さと方向を測定します。ただし、スピアマンの相関係数について説明する前に、まずピアソンの相関を理解することが重要です。ピアソン相関は、ペアのデータ間の線形関係の強さの統計的尺度です。
ランキング変数の計算と有意性検定では、次のデータの仮定が当てはまる必要があります。
データが上記の仮定を満たさない場合は、スピアマンの係数が必要になります。スピアマンの相関係数を理解するには、単調関数とは何かを知る必要があります。単調関数は、独立変数の増加であるため、減少しないか、増加しない関数です。単調関数は、以下の画像を使用して説明できます。
この画像は、単調関数の3つの概念を説明しています。
- 単調に増加する:「x」変数が増加し、「y」変数が減少しない場合。
- 単調に減少する:「x」変数は増加するが、「y」変数は決して増加しない場合
- 単調ではない:「x」変数が増加し、「y」変数が増加する場合と減少する場合があります。
単調な関係は、ピアソンの係数で使用される線形の関係と比較すると、制限が少なくなります。単調性はスピアマン相関係数の最終的な要件ではありませんが、変数間の関係が非単調であることがすでにわかっている場合は、単調関係の強度と方向を実際に決定せずにスピアマンの相関を追求することは意味がありません。
スピアマン相関係数:式と例による計算
ここ、
n =2つの変数のデータポイントの数
di =「i番目」の要素のランクの違い
スピアマンの係数⍴は、+ 1から-1の間の値を取ることができます。ここで、
- ⍴値+1は、ランクの完全な関連付けを意味します
- ⍴値0は、ランクの関連付けがないことを意味します
- ⍴値-1は、ランク間の完全な負の関連を意味します。
⍴値を0に近づけると、2つのランク間の関連付けが弱くなります。
スピアマンの順位相関係数に進む前に、データをランク付けできる必要があります。一方の変数を増やすと、もう一方の変数が単調な関係に従うかどうかを観察することが重要です。
すべてのレベルで、2つの変数の値を比較する必要があります。計算の仕組みは次のとおりです。
歴史と地理の9人の学生のスコアは、以下の表に記載されています。
ステップ1-取得したデータのテーブルを作成します。
ステップ2-2つのデータセットをランク付けすることから始めます。データのランク付けは、列の最大の番号に「1」、2番目に大きい番号に「2」というように割り当てることで実現できます。通常、最小値が最低ランクになります。これは、両方の測定セットに対して実行する必要があります。
ステップ3-3番目の列dをデータセットに追加します。ここでのdは、ランク間の差を示します。たとえば、最初の学生の物理学のランクが3で、数学のランクが5の場合、ランクの差は3です。4番目の列で、dの値を2乗します。
歴史 | ランク | 地理 | ランク | d | dスクエア |
35 | 3 | 30 | 5 | 2 | 4 |
23 | 5 | 33 | 3 | 2 | 4 |
47 | 1 | 45 | 2 | 1 | 1 |
17 | 6 | 23 | 6 | 0 | 0 |
10 | 7 | 8 | 8 | 1 | 1 |
43 | 2 | 49 | 1 | 1 | 1 |
9 | 8 | 12 | 7 | 1 | 1 |
6 | 9 | 4 | 9 | 0 | 0 |
28 | 4 | 31 | 4 | 0 | 0 |
12 |
ステップ4-すべてのd二乗値を合計します。これは12(∑d二乗)です。
ステップ5-これらの値を数式に挿入します
= 1-(6 * 12)/ (9(81-1))
= 1-72 / 720
= 1-01
= 0.9
このデータのスピアマンの順位相関は0.9であり、前述のように、⍴値が+1に近い場合、順位は完全に関連付けられています。
QuestionProでスピアマンの相関係数を実行する方法
このセクションでは、調査でスピアマンの順位相関係数を実行する方法を学習します。
ステップ1: [マイアンケート]→[アンケートの選択]→[分析]に移動します
ステップ2:分析の下の相関分析をクリックします
ステップ3: [スピアマン係数の生成]ボタンをクリックして、詳細なレポートを取得します
上記の例では、スピアマンの相関係数を使用して、2つの変数、作業経験と月収の関係を調べています。一般的な概念は、月収は仕事の経験とともに増加するはずです。つまり、0.97のrs値によって証明される2つの変数の間に正の関連があるはずです。