基礎数学 – 統計数理基礎 – 代表値(平均値、中央値、最頻値)

代表値(たいひょうち)とは、データの集合を代表する値のことで、データの特徴を表すのに使われます。主に「平均値」「中央値」「最頻値」の3種類があります。これらの代表値を使うことで、データ全体の傾向を理解しやすくなります。

平均値(Mean)

平均値は、データの合計をデータの個数で割ったものです。データ全体の「平均的な値」を示します。例えば、あるクラスの生徒の数学のテストの点数が、50点、60点、70点だった場合、これらの平均値は(50+60+70)/ 3 = 60点になります。平均値はデータの全体的な中心を示すが、外れ値(非常に高い値や低い値)の影響を受けやすいという特徴があります。

 

中央値(Median)

中央値は、データを小さい順に並べたときに、ちょうど中央に位置する値です。データの個数が奇数の場合は、中央の値そのものが中央値です。偶数の場合は、中央に位置する2つの値の平均が中央値になります。例えば、数学のテストの点数が、40点、50点、60点、70点、80点だった場合、中央値は60点になります。中央値は外れ値の影響を受けにくいという特徴があります。

 

最頻値(Mode)

最頻値は、データの中で最も頻繁に出現する値です。全てのデータが異なる値の場合、最頻値は存在しません。また、2つ以上の値が同じ最高頻度で出現する場合、それら全てが最頻値になります。例えば、テストの点数が、50点、60点、60点、70点だった場合、最頻値は60点になります。

 

 

これらの代表値を適切に使い分けることで、データの集合をより良く理解し、解釈することができます。データの分布によっては、これらの代表値が大きく異なることもあり、その場合はデータの分布についてさらに考察が必要です。