確率
Probability
確率(probability)とは、現象に対する偶然的な頻度のことで、統計的検定の基礎となる概念です。
確率は「面積」に例えるとわかりやすいかもしれません。現象全体が存在する領域の面積1.0とすると、その中で起こる様々な事象の確率は、それを囲む領域の面積と考えることができます。確率密度関数も「山の面積」は 1.0です。
ベン図を使ってみましょう。「全体集合Uの面積」を 1.0 とすると、「Aが囲む面積」がAが起こる確率、「AとBの交わる面積」がAとBの同時確率、「交わり部分の面積 / Aの面積」が Aを前提として Bが起こる条件付き確率・・
Keywords
確率変数
様々な値をとりうる変数 X があって、それぞれの値をとる確率が決まっているとき、この X を確率変数(random variable)といいます。
例えば、さいころを投げたとき出る目の数 X は、1から6までのいずれかであり、それぞれ 1/6 の確率をもつことで、X は確率変数と言えます。
これは、次のように表すことができます(括弧の中は X がとる値の範囲)。
また「3の目が出る事象の確率は 1/6 である」ことを以下のように書きます。
一般的な関数とは異なり、確率関数では変数は実数ではなく「事象」です。また、1,2,3・・ などの実現した事象を示す値を「実現値」といいます。
確率分布
確率分布(probability distribution)とは、横軸に確率変数、縦軸にその確率を表したものです。確率変数には、離散型確率変数(discrete random variable)と連続型確率変数(continuous random variable)とがあって、離散型確率変数の場合の確率分布は「確率質量関数」、連続型確率変数の場合の確率分布は「確率密度関数」で表されます。
- 確率変数が離散型のカテゴリ変数の場合
- 例えば、クラスの中から一人を選んだとき、それが野球部、サッカー部・・・の部員である確率。例えば、 \(P(X=野球部) = 1/8\) など
- カテゴリ変数の場合、X自体の順序、計算(平均)には意味はありません。
- 確率変数が離散型の量的変数の場合
- 例えば、サイコロを振って1〜6の目がそれぞれ出る確率(1/6)
- 期待値(平均)の計算に意味があります(期待値:3.5)
- 確率変数が連続型の場合
値に幅をもたせてその範囲に入る確率を求めします。確率を導出するには、一般に確率密度関数を用います。確率密度関数では、変数の定義域全体で積分すると(つまりグラフの山の面積は)1.0 となります。
代表的な確率分布
理論的な確率分布は一般に数式で表されます。分布の形を決める数値をパラメータといい、例えば正規分布の場合、平均 \(μ\) と標準偏差 \(σ\) という2つのパラメータを持ちます。代表的な確率分布に以下のようなものがあります。
期待値
確率変数が量的な変数である場合、確率分布を特徴づける量のひとつに期待値(Expected Value)があります。これは事実上「平均値」です。
- 離散型分布の場合の期待値
\[E(X) = \sum_{i=1}^{k} x_i P(X=x_i) \]
- 連続型分布の場合の期待値
\[E(X) = \int x f(x) dx \]
分散と標準偏差
確率分布を特徴づける量には、確率分布が期待値の周りにどの程度広がっているかを表す値も重要で、分散と標準偏差がこれにあたります。記述統計量の計算で紹介したものと同様です。
- 離散型分布の場合の分散
\[V(X) = \sum_{i=1}^{k} (x_i - E(X))^2 P(X=x_i) \]
- 連続型分布の場合の分散
\[V(X) = \int (x - E(X))^2 f(x) dx \]
尚、標準偏差は分散 V(X) の平方根をとった値として定義されます。
歪度と尖度
上記の期待値と分散以外で、確率分布を特徴づける値に歪度と尖度があります。
- 歪度(skewness):分布の非対称性を示す指標
- 尖度(kurtosis):分布の尖り度合い(一般に正規分布の尖度を 0とする)
同時確率について
2つの確率変数を同時に考えた場合の確率を「同時確率」といいます。
例えば、2つのサイコロA,Bがあって、Aの出る目がX、Bの出る目がYの場合、Aが2でBが3の場合の確率は、
\(P(X=1, Y=2)\)
と表します。
- 同時確率は条件付き確率(次節)を用いて以下のように書けます。
\[P(X,Y) = P(X|Y) P(Y)\]
- 付記:2つの変数が独立であれば、以下の関係が成立します。
\[P(X,Y) = P(X) P(Y)\]
条件付き確率について
ひとつの確率変数Yの値を前提とした場合の、もう一方の確率変数Xの確率(ある事象が起こったという条件(前提)の下で別の事象が起こる確率)を「条件付き確率」といい、 \(P(X|Y)\) のように表します。
- 条件付き確率は、同時確率を使って以下のように計算できます。前提がわかっているわけですから、当然同時確率よりは大きな値になります。
\[P(X|Y) = \frac{P(X,Y)}{P(Y)}\]
- 付記1:条件付き確率を使って同時確率を表現したのが以下。
\[P(X,Y) = P(X|Y) P(Y)\]
- 付記2:XとYが独立である場合は以下の関係が成立します。
\[P(X|Y) = P(X)\]