χ-squared test
(書きかけです)
カイ2乗検定は、名義尺度データに対する検定として用いられるもので、「適合度の検定」や「独立性の検定」に用いられます。
各カテゴリの度数に対して仮説を設定して(例えば、4つの血液型の比率は、A:B:O:AB = 4:3:2:1 であるとして)、実際のデータのカテゴリ度数が仮説とマッチするかを調べる検定を「適合度の検定」と言います。
以下の式で求められます。
クロス集計表の縦軸と横軸に置かれる2つの質的変数(例えば、性別と喫煙)の間に独立性があるか(あるいは連関があるか)を確認するための検定を「独立性の検定」と言います。
以下の式で求められます。
以下、2X2のクロス集計表の例です。ちなみに太字部分を観測度数、縦横の合計欄に記載された各カテゴリの合計を周辺度数と言います。
喫煙者 | 非喫煙者 | 合計 | |
男 | 50 | 50 | 100 |
女 | 100 | 50 | 150 |
合計 | 150 | 100 | 250 |
ここで「性別と喫煙には関係がない」という帰無仮説に従って、周辺度数の値をもとに期待度数を逆算すると*1、以下のような期待度数(太字部分)が算出されます。
喫煙者 | 非喫煙者 | 計 | |
男 | 60 | 40 | 100 |
女 | 90 | 60 | 150 |
合計 | 150 | 100 | 250 |