Normal Distribution / Gaussian Distribution
正規分布とは、身長、体重、成績などの分布グラフでよく見かける、平均値を中心とした左右対称な山型の分布で「ベルカーブ」とも呼ばれます。平均値と最頻値・中央値が一致するという特徴を持ち、自然界の現象から人間の行動まで、あらゆる現象によく当てはまる標準的な確率分布です。天文観測データの測定誤差がある法則に従うことを数学者C.F.ガウスが見出した経緯もあって「ガウス分布」とも呼ばれます。 \(X 〜 N( μ, σ^2 )\) と書きます。
中心極限定理により、独立な多数の変数の和として表される確率変数は正規分布に従うことが知られていて、このことから、統計学をはじめとする様々な分野で現象をシンプルに扱うためのモデルとして用いられています。
一般に、正規化した Z 値を求めることで標準正規分布表と呼ばれる一覧表を用いて、正規分布に従った事象の確率を求めることができます。
表の縦軸は、確率変数 z の上位桁、横軸は 下位桁の値です。例えば「z = 1.96 以上」となる確率は、表の縦軸 1.9 と横軸 6 の交差する部分から 0.024998 などと求められます。
正規分布 \(N(μ_1, σ_1^2)\) に従うデータと、それとは独立な \(N(μ_2, σ_2^2)\) に従うデータの和も、正規分布 \(N(μ_1 + μ_2, σ_1^2 +σ_2^2 )\) に従います。このことを「正規分布には再生性がある」といいます。
例えば、国語・数学・英語の点数が、それぞれ独立に正規分布に従う場合、その合計得点も平均と分散、それぞれの和をとった正規分布に従います。
母平均 が μ の母集団から標本を抽出した場合、サンプルのサイズ(=標本の大きさ)が大きくなるにつれて、標本平均は母平均 μ に近づきます。標本から母平均を推測する場合は「サンプルサイズが大きいほど良い」という直感的にもあたりまえの話ですが・・
母集団から標本を抽出する場合、母集団の性質によらず、抽出するサンプルサイズが大きくなるに従って、標本平均の分布は以下の正規分布 に近づきます。