#author("2023-01-31T17:47:21+09:00","default:inoue.ko","inoue.ko") *確率 Probability ~ (書きかけです) ~ ***確率変数 値が確率的に変動するような変数X を確率変数と言います。例えば、さいころを投げたとき出る目の数を Xは、1から6までのいずれかでり、それぞれ 1/6 の確率をもつことで、X は確率変数と言えます。 これは、次のように表すことができます(括弧の中は X がとる値の範囲)。 #mathjax(P(X) = \frac{1}{6} (X = 1,2,3,4,5,6)) また「3の目が出る事象の確率は 1/6 である」ことを以下のように書きます。 #mathjax(P(X=3) = \frac{1}{6}) ~ ***確率分布 確率分布(probability distribution)とは、横軸に確率変数、縦軸にその確率を表したものです。 -確率変数がカテゴリ変数の場合 --例えば、クラスの中から一人を選んだとき、それが野球部、サッカー部・・・の部員である確率。例えば、&mathjax(P(X=野球部) = 1/8); など --当然ですが、すべての部活について確率を合計すると1になります。 --カテゴリ変数の場合、グラフのX軸方向の順番には意味はなく、期待値の計算にも意味はありません。 -離散型の量的変数の場合 --例えば、サイコロを振って1〜6の目がそれぞれ出る確率(1/6) --期待値(平均)の計算に意味があります(期待値:3.5) -連続型の確率変数の場合 値に幅をもたせてその範囲に入る確率を求めします。確率を導出するには、一般に確率密度関数を用います。確率密度関数では、変数の定義域全体で積分すると(つまりグラフの山の面積は)1となります。 ~ ***代表的な確率分布 代表的な確率分布に、以下のようなものがあります。 -離散型確率分布 --ポアソン分布 --二項分布 --幾何分布 --一様分布 -連続型確率分布 --正規分布 --指数分布 --ガンマ分布 --一様分布 -検定統計量が従う(連続型)確率分布 --t分布 --F分布 --&mathjax(χ^2);分布 ~ ***期待値 確率変数が量的な変数である場合、確率分布を特徴づける量のひとつに''期待値''(Expected Value)があります。これは事実上「平均値」です。 -離散型分布の場合の期待値 #mathjax(E(X) = \sum_{i=1}^k x_i P(X=x_i) ) -連続型分布の場合の期待値 #mathjax(E(X) = \int x f(x) dx ) ~ ~ ***分散と標準偏差 ~ ~ ***歪度と尖度 ~ ~ ~ **APPENDIX ***関連ページ -[[Statistics]] --[[Statistics/Descriptive]] --[[Statistics/Inferential]] --[[Statistics/Probability]] --[[Statistics/HypothesisTesting]] --[[Statistics/Bayesian]] --[[Statistics/MultivariateAnalysis]] -[[DataScience]] -[[ArtificialIntelligence]] -[[ArtificialIntelligence/Links]] -[[Data]] -[[Statistics]] -[[DataVisualization]] -[[MachineLearning]] --[[DecisionTree]] --[[k-means]] --[[LinearRegression]] --[[LogisticRegression]] --[[NeuralNetwork]] --[[PrincipalComponentAnalysis]] --[[RandomForest]] --[[SupportVectorMachine]] -[[DataMining]] -[[Python]] --[[Pandas]] --[[scikit-learn]] -[[GoogleColaboratory]] -[[Orange]] -[[OpenData]] ~ ~ ~