LogoMark.png

Statistics/Inferential のバックアップ(No.3)


推測統計

Inferential Statistics


推測統計とは、無作為抽出されたデータから母集団の特徴・性質を推定する統計のことで、推計統計とも言います。記述統計と異なり、集められたデータは大きな母集団の中の小さな標本に過ぎないと考えます。

母集団(population)と標本(sample)

一般に母集団というものは観念的な存在で、現実に観測できるのは標本です。例えば「視聴率」の調査に関して言えば、「全世帯」が母集団で、「調査世帯」が標本です。

100人に聞きました。AとBどっちが好き・・
>「Aが好き」と答えた人が70人ということで、
Aが好きな人が多いことがわかりました。

という話は、それはそれでいいのですが、この結果をもって「日本人はAが好き」とか「人間というものはAが好き」とは断言できません。

一般に多くの実験研究が、標本調査をもって、それを一般論に拡大しています。実は、これはあくまでも「確率的にそうである可能性が高い」という話で、ひょっとしたら間違いかもしれません。ただ、実際には母集団をすべて調べるわけにはいかないので、標本から得られる統計量を根拠に、「ああであればこうである」といった記述がなされているのです。

推測統計というのは、文字通り「推測」。あくまでも確率的な問題として、物事の関係を科学的に語るための統計手法です。

母数

推測統計では母集団の特性をあらわす数を母数(parameter)と言います。
推測される母数には、以下のようなものがあります。

標本サイズと標本数

この2つの言葉は似て非なるものなので、注意が必要です。

推測統計における統計量

推測統計では「標本を要約して母数の推測に用いるもの」を統計量(statistic)と言います。標本として得られたデータに対しで記述統計と同じ計算方法で算出されるものです。

推測統計における母数の推定量

付記
言葉は似ていても意味が異なるので、母分散 \(σ^2\) 、標本分散 \(s^2\) 、不偏分散 \(u^2\) など、区別のために異なる記号を用いるのが通例です。

統計的な推定

統計的な推定には、点推定と区間推定があります。