母分散と標本分散について簡単に説明します。
母分散 (Population Variance)
母分散は、母集団全体の各データが平均からどれだけ離れて分布しているかを表す統計量です。母分散は、母集団の全ての個体についてのデータを使用して計算されます。母分散の計算式は以下の通りです。
\[ \sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (X_i – \mu)^2 \]
ここで、
– \(\sigma^2\)は母分散を示します。
– \(N\)は母集団の個体の総数です。
– \(X_i\)は個々のデータ値です。
– \(\mu\)は母平均(母集団の平均値)です。
母分散は、母集団のデータ全体のばらつき具合を示す値で、値が大きいほどデータは平均値から大きくばらついていることを意味します。
標本分散 (Sample Variance)
標本分散は、母集団から抽出された標本におけるデータのばらつきを表す統計量です。標本分散は標本データを使用して計算され、以下の式に従います。
\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i – \bar{x})^2 \]
ここで、
– \(s^2\)は標本分散を示します。
– \(n\)は標本のサイズ(データ点の数)です。
– \(x_i\)は標本の各データ値です。
– \(\bar{x}\)は標本平均です。
標本分散では、分母が\(n-1\)になっている点に注意してください。これは「自由度の補正」と呼ばれ、標本から得られた平均が母平均に比べて不偏であるための調整です。これにより、標本から推測される母集団の分散がより正確になります。
要するに、母分散は母集団全体のデータのばらつきを示し、標本分散はその標本におけるデータのばらつきを示します。標本分散は母分散の推定値として使用されますが、推定の精度を高めるために分母に\(n-1\)を使用します。