基礎数学 – 統計数理基礎 – ピアソンの相関係数

ピアソンの相関係数について

ピアソンの相関係数は、二つの変数間の相関(線形関係の強さと方向)を測定するために用いられる統計的手法です。この係数は-1から1までの値を取り、-1は完全な負の相関、0は相関がないこと、1は完全な正の相関を意味します。

相関係数の意味

相関係数が正の場合、一方の変数が増加するともう一方の変数も増加します。相関係数が負の場合、一方の変数が増加するともう一方の変数は減少します。相関係数が0に近い場合、二つの変数間にはあまりまたは全く関係がないことを示します。

計算方法

ピアソンの相関係数は以下の公式で計算されます:

\[ r = \frac{n(\sum xy) – (\sum x)(\sum y)}{\sqrt{[n\sum x^2 – (\sum x)^2][n\sum y^2 – (\sum y)^2]}} \]

具体例

10人の学生の数学のテストスコアとそれに費やした勉強時間を考えてみましょう。

 

学生 勉強時間 (X) テストスコア (Y)
1 2 58
2 4 70
3 6 80
4 8 88
5 10 90
6 1 54
7 3 66
8 5 76
9 7 84
10 9 92

具体的な計算方法です。与えられたデータは次の通りです:

– 勉強時間 \(X\): \([2, 4, 6, 8, 10, 1, 3, 5, 7, 9]\)
– テストスコア \(Y\): \([58, 70, 80, 88, 90, 54, 66, 76, 84, 92]\)

これらを用いて、以下の値を計算します:

1. \(n\): データポイントの数
2. \(\sum x\): 勉強時間の合計
3. \(\sum y\): テストスコアの合計
4. \(\sum xy\): 勉強時間とテストスコアの積の合計
5. \(\sum x^2\): 勉強時間の二乗の合計
6. \(\sum y^2\): テストスコアの二乗の合計

これらの値を用いて分子と分母を計算します。

– 分子は \(n(\sum xy) – (\sum x)(\sum y)\)
– 分母は \(\sqrt{[n\sum x^2 – (\sum x)^2][n\sum y^2 – (\sum y)^2]}\)

分子と分母を計算し、それらの値から相関係数 \(r\) を求めます。

ここでは、計算の過程を具体的に示します。

計算過程は以下の通りです:

1. \(n\) (データポイントの数): \(10\)
2. \(\sum x\) (勉強時間の合計): \(55\)
3. \(\sum y\) (テストスコアの合計): \(758\)
4. \(\sum xy\) (勉強時間とテストスコアの積の合計): \(4528\)
5. \(\sum x^2\) (勉強時間の二乗の合計): \(385\)
6. \(\sum y^2\) (テストスコアの二乗の合計): \(59076\)

これらの値を用いて、

– 分子 \(n(\sum xy) – (\sum x)(\sum y)\) = \(10 \times 4528 – 55 \times 758 = 3590\)
– 分母 \(\sqrt{[n\sum x^2 – (\sum x)^2][n\sum y^2 – (\sum y)^2]}\) = \(\sqrt{[10 \times 385 – 55^2][10 \times 59076 – 758^2]} \approx 3655.366\)

以上の計算から、相関係数 \(r\) は分子を分母で割った値、つまり \(\frac{3590}{3655.366} \approx 0.982\) となります。

この計算過程を通して、勉強時間とテストスコアの間には非常に強い正の相関があることが数値的に確認できます。
このデータを用いてピアソンの相関係数を計算してみましょう。これにより、勉強時間とテストスコアの間にどのような相関が存在するかを明らかにできます。