LogoMark.png

Statistics/ExponentialDistribution

指数分布

Exponential Distribution

ExponentialDistribution.png

指数分布とは、単位時間に平均して λ(ラムダ)回起こる現象が、次に起こるまでの時間 X が従う確率分布です。 \(X 〜 E_x(λ)\) と書きます。
Source:Wikimedia Commons File:Exponential distribution pdf.png

単位時間に平均して λ(ラムダ)回起こる現象とは、言い換えると、1/ λ(単位時間)が X の平均的な値(期待値)になるということで、λ が大きくなるほど、期待値が小さく、グラフは左に寄る・・というイメージになります。

機械が故障してから次に故障するまでの時間や、客が来てから次の客が来るまでの時間などを統計的に扱う場合に、指数分布を使います。

指数分布はポアソン分布と深い関係にあります。ポアソン分布は、単位時間内に事象の起こる回数の確率を表現する一方、指数分布は事象の起こる間隔の確率を表現しています。同じ事象を裏返しに見ているわけで、指数分布の平均が1/ λ になるのは、そのことを示しています。

確率密度関数

指数分布は、単位時間中にある事象が発生する平均回数 λ をパラメータとして、以下のように書けます。

\[ f(x) = λ e^{-λx} ( x \geq 0 )\]
\[ f(x) = 0 ( x < 0 )\]

λ というパラメータは、指数分布の確率変数である「時間 X 」の期待値の逆数で、直感的にはわかりにくいので、期待値 μ = 1/λ を利用して、以下のように書く場合もあります。

\[ f(x) = \frac{1}{μ} e^{-\frac{x}{μ}} ( x \geq 0 )\]
\[ f(x) = 0 ( x < 0 )\]

ちなみに、Python の NumPyライブラリが持っている「指数分布乱数」の解説でも、確率密度関数が期待値( β = 1/λ )を使った表現になっていて、 パラメータとしては期待値(β)を渡す形式になっています。
NumPy:numpy.random.exponential

累積分布関数

ExponentialDistributionCDF.png

指数分布はポアソン分布と異なり、連続型の分布なので、実際に確率を計算する場合は、累積確率を計算するのが一般的で、例えば X:0 〜 x の累積確率は、以下のようになります。
Source:Wikimedia Commons File:Exponential distribution cdf.png

\[ F(\leqq x) = 1 - e^{-λx} \]

例えば、1時間に平均5人の客が来る(λ = 5、客の平均到着間隔は12分)窓口で、次の客が来るまでの間隔が15分(x = 0.25)以内である確率は、以下のように計算できます(単位時間は1時間です)。

\[ F(\leqq 0.25) = 1 - e^{-5 \times 0.25} = 1 - 0.286 = 0.714 \]


期待値と分散

APPENDIX

参考事例:南海トラフ地震が 今後30年以内におこる確率

関連ページ

PAGES

GUIDE

DATA

添付ファイル: fileExponentialDistributionCDF.png 40件 [詳細] fileExponentialDistribution.png 35件 [詳細]
Last-modified: 2023-02-03 (金) 17:27:57