Analysis of Variance
(書きかけです)
分散分析とは、統計量がF分布に従うことを前提としたパラメトリック検定*1の一種です。3つ以上の群(水準)に対して、効果による分散(群間変動)と誤差による分散(群内変動)との比(F値)を F検定を用いて確認することで、各水準の母平均に誤差以上の効果があるか否かを判断する・・というものです。
分散分析を行うには、対象となるデータの分布が1) 正規分布に従っていること(正規性)、2) 分散の等質性があること、3) 観測値の独立性(無作為標本)があることが前提となります。
分散分析の帰無仮説と対立仮説を、3群の分散分析の場合を例に確認します。
以下、A・B・C の3社の製品の耐久性を比較する・・という例で、分散分析の用語について概説します。
データの値を変化させる原因を「要因」といいます。この場合「会社」です。要因の数は複数設定されることもあります。例えば、A・B・Cの3社の製品を、それぞれ、温暖な地域で使用した場合と、寒冷な地域で使用した場合とで比較する場合、要因は2つ。ひとつは「製造会社」もうひとつは「気候」です。この場合、3x2 で6種類の評価実験が必要になります。
要因を構成する条件を「水準(群)」といいます。上の例で「会社」要因で言えば、A・B・Cの3つの「水準(群)」が存在します。
分散分析には大きく一元配置と二元配置(多元配置)の2種類があります。
被験者間計画とは、ひとりの被験者をひとつの水準にのみ割り当てるケース。例えばA社の製品を10人、B社製品10人、C社製品10人、全体で30人が評価する実験計画。一方、被験者内計画とは、同じ被験者をすべての水準に割り当てる場合。例えば30人全員が、A,B,C,すべての製品を評価する実験計画。当然検定力は上がります。
要因と被験者の計悪を組み合わせて、「1要因被験者間計画」、「2要因被験者内計画」といった実験計画が行われます。
特定の要因単独で有意に差が認められるときは,主効果(または単純主効果)がある・・といいます。
要因を組み合わせた場合の複合的な効果がある場合は、交互作用がある・・といいます。
多重比較(Multiple Comparison Procedure)とは水準間の平均値の差を比較する検定手法で、これを用いると、3水準以上の比較において、どの水準間に差があるかを調べることができます。
一般に、分散分析で有意と判断された場合、その下位検定(事後検定)として多重比較が行われますが、分散分析では有意なのに、多重比較では群間の有意差が見いだせない場合や、あるいはその逆の場合あり、分散分析と多重比較は独立に行うものと考えた方が良いとされています。
多重比較には様々な種類があって、分散分析を事前に行うことを前提とした Scheffe法や、分散分析とは独立に群間の有意差検定が可能な Bonferroni法、Tukey-Kramer法などがあります。
分散分析の結果は、一般に「分散分析表」の形で提示します。一元配置と二元配置では、異なるので、それぞれ事例を紹介します。
要因 | 平方和 S | 自由度 df | 平均平方 V | F値 |
群間 | 32 | 2 | 16.00 | 13.11 |
群内 | 11 | 9 | 1.22 | |
全体 | 43 | 11 |
(書きかけです)