基礎数学 – 統計数理基礎 – 標準正規分布の平均と分散

標準正規分布は統計学における重要な分布の一つで、平均が0、分散が1の正規分布を指します。正規分布は自然界や社会科学など、様々な現象において観測されるデータの分布を表すのによく用いられる形状をしています。正規分布は、その形状が左右対称でベル型(ガウス分布とも呼ばれます)をしており、平均値を中心にしてデータが集まり、平均値から離れるにつれてデータの頻度が減少する特徴があります。

 

 

平均(μ)

平均はデータの中心的な傾向を表す指標で、正規分布においては最もデータが集中している点、つまりベルカーブの頂点を示します。標準正規分布では、この平均値が0に設定されています。これは標準化された値を扱うことにより、異なるデータセットや異なる分布を容易に比較できるようにするためです。

 

 

分散 (σ²)

分散はデータが平均値からどれだけ散らばっているかを量る指標で、正規分布の形状の広がりを決定します。分散が大きいほどデータは平均値から広がり、ベルカーブはより平坦になります。逆に分散が小さいと、データは平均値に近く集中し、ベルカーブはより尖った形状になります。標準正規分布では、この分散が1に設定されています。これにより、標準偏差(分散の平方根)も1となり、データの散らばり具合を直感的に理解しやすくなります。

 

 

標準正規分布の利用

標準正規分布は統計分析において非常に役立ちます。例えば、異なる平均や分散を持つ正規分布からのデータを標準化することで、それらを直接比較することができます。また、特定のデータが全体の分布の中でどの位置にあるかを評価するためにも使われます(例: zスコア)。このように、標準正規分布は統計的な分析や推測統計学において基礎的かつ強力なツールとなっています。

 

 

 

標準正規分布を理解するために、具体的な数値を使った例を見てみましょう。まず、正規分布に従うデータセットを想定し、その後、それを標準正規分布に変換する過程を見てみます。

 

正規分布の例

想定するデータセットは、ある試験の成績で、生徒たちのスコアが平均が70点、標準偏差が10点の正規分布に従うとします。この場合、ほとんどの生徒のスコアは60点から80点の間に集中していることになります。これは、平均±1標準偏差(70±10)の範囲にデータの約68%が含まれるという正規分布の性質によるものです。

 

 

標準正規分布への変換

このデータセットを標準正規分布に変換するには、各スコアから平均値(70点)を引いて、標準偏差(10点)で割ります。これにより、変換後のデータセットの平均は0、標準偏差は1になります。これを標準化と呼びます。

 

 

具体例として、80点のスコアを標準化してみましょう。
– 元のスコアは80点です。
– 平均値70点をスコアから引きます: 80 – 70 = 10
– その結果を標準偏差10で割ります: 10 / 10 = 1

この計算により、80点のスコアは標準正規分布においては1となります。つまり、このスコアは平均から1標準偏差分だけ高い位置にあることを意味します。

同様に、60点のスコアを標準化すると、
– 60 – 70 = -10
– -10 / 10 = -1
となり、このスコアは標準正規分布においては-1に相当します。つまり、60点は平均から1標準偏差分だけ低い位置にあります。

 

 

結果の解釈

標準正規分布に変換することで、異なる平均や標準偏差を持つデータセットを共通の尺度で比較することが可能になります。また、標準化されたスコア(zスコア)を使用すると、ある値が分布の中でどの位置にあるのかを簡単に判断できます。例えば、zスコアが1ならば、その値は平均よりも高い(上位約16%に位置する)ことがわかります。このように標準正規分布は、データの位置や散らばり具合を理解するための強力なツールです。