LogoMark.png

Statistics/Probability のバックアップ(No.4)


確率

Probability

確率(probability)とは、現象に対する偶然的な頻度のことで、統計的検定の基礎となる概念です。

確率は面積に例えるとわかりやすいかもしれません。現象全体が存在する領域の面積1.0とすると、その中で起こる様々な事象の確率は、それを囲む領域の面積と考えることができます。確率密度関数も「山の面積」は 1.0です。

Venn.png

ベン図を使ってみましょう。「全体集合Uの面積」を 1.0 とすると、「Aが囲む面積」がAが起こる確率、「AとBの交わる面積」がAとBの同時確率、「交わり部分の面積 / Aの面積」が Aを前提として Bが起こる条件付き確率・・



Keywords

確率変数

値が確率的に変動するような変数X を確率変数と言います。例えば、さいころを投げたとき出る目の数を Xは、1から6までのいずれかでり、それぞれ 1/6 の確率をもつことで、X は確率変数と言えます。

これは、次のように表すことができます(括弧の中は X がとる値の範囲)。

\[P(X) = \frac{1}{6} (X = 1,2,3,4,5,6)\]

また「3の目が出る事象の確率は 1/6 である」ことを以下のように書きます。

\[P(X=3) = \frac{1}{6}\]


確率分布

確率分布(probability distribution)とは、横軸に確率変数、縦軸にその確率を表したものです。

代表的な確率分布

代表的な確率分布に、以下のようなものがあります。

期待値

確率変数が量的な変数である場合、確率分布を特徴づける量のひとつに期待値(Expected Value)があります。これは事実上「平均値」です。

分散と標準偏差

確率分布を特徴づける量には、確率分布が期待値の周りにどの程度広がっているかを表す値も重要で、分散と標準偏差がこれにあたります。記述統計量の計算で紹介したものと同様です。

尚、標準偏差は分散 V(X) の平方根をとった値として定義されます。

歪度と尖度

上記の期待値と分散以外で、確率分布を特徴づける値に歪度と尖度があります。

同時確率について

2つの確率変数を同時に考えた場合の確率を「同時確率」といいます。
例えば、2つのサイコロA,Bがあって、Aの出る目がX、Bの出る目がYの場合、Aが2でBが3の場合の確率は、 \(P(X=1, Y=2)\) と表します。

条件付き確率について

ひとつの確率変数Yの値を前提とした場合の、もう一方の確率変数Xの確率(ある事象が起こったという条件(前提)の下で別の事象が起こる確率)を「条件付き確率」といい、 \(P(X|Y)\) のように表します。

関連事項:Statistics/Bayesian



APPENDIX

関連ページ