ANOVA
Analysis of Variance
(書きかけです)
概要
分散分析とは、統計量がF分布に従うことを前提としたパラメトリック検定*1の一種です。3つ以上の群(水準)に対して、誤差による分散(群内変動)と効果による分散(群間変動)の比を F検定を用いて確認することで、各水準の母平均に誤差以上の効果があるか否かを判断する・・というものです。
前提
帰無仮説
分散分析の帰無仮説と対立仮説を、3群の分散分析の場合を例に確認します。
- 帰無仮説H0:A群の母平均 = B群の母平均 = C群の母平均
- 対立仮説H1:A群、B群、C群の母平均の中のいずれかに異なる値がある
分散分析表
要因 | 平方和 S | 自由度 df | 不偏分散 V | F値 |
群 | S(群) | df(群) (群の数 -1) | V(群) | V(群)/V(残) |
残差 | S(残差) | df(残差) (全データ - 群の数) | V(残差) (S(残)/df(差)) | |
全体 | S(全体) | df(全体) | | |
- 平方和、自由度、不偏分散 > F値(群の不偏分散と残差の不偏分散の比)
- F値を F分布表に照らして > P値
事例解説
以下、A,B,Cの3社の製品の耐久性を比較する・・という話で、分散分析の概要について説明します。
- 要因
データの値を変化させる原因を「要因」といいます。この場合「会社」です。要因の数は複数設定されることもあります。例えば、A,B,Cの3社の製品を、それぞれ、温暖な地域で使用した場合と、寒冷な地域で使用した場合とで比較する場合、要因は2つ。ひとつは「会社」もうひとつは「気候」です。3x2 で6種類の評価実験が必要になります。
- 水準
要因を構成する条件を「水準」といいます。この場合 A、B、Cの3つです。
- 被験者間計画
ひとりの被験者をひとつの水準にのみ割り当てるケース。例えばA社の製品を10人、B社製品10人、C社製品10人、全体で30人が評価する実験計画。
- 被験者内計画
同じ被験者をすべての水準に割り当てる場合。例えば30人全員が、A,B,C,すべての製品を評価する実験計画。当然検定力は上がります。
これらを組み合わせて、「1要因被験者間計画」とか、「2要因被験者内計画」といった実験計画が行われます。以下も重要なキーワードです。
- 主効果 main effect
特定の要因単独で有意に差が認められるときは,主効果(または単純主効果)がある・・といいます。
- 交互作用 interaction
要因を組み合わせた場合の複合的な効果がある場合は、交互作用がある・・といいます。
要因が1つの場合、以下の手順で検定します。
- 主効果の有無を確認します。
- 主効果が有意である場合には、次に多重比較を行います。多重比較というのは、各水準間で具体的に、どれとどれに差があるのかを見極める作業です。
要因が2つ以上になった場合、検定の手順は煩雑になってきます。
- 2要因の分散分析では、まず2つの要因の交互作用を検証します。
- 交互作用が認められなかった場合は主効果を検定を行います。主効果が有意である場合には必要に応じて多重比較を行います。
- 交互作用が認められた場合は、単純主効果の検定を行います。たとえば要因Aと要因Bの交互作用が有意である場合、要因Bの特定水準における要因Aの主効果、また要因Aの特定水準における要因Bの主効果について分析を行います。単純主効果が有意である場合には、必要に応じて多重比較を行います。