Student's t-test
t検定(t-test)とは、統計量が t分布に従うことを前提とするパラメトリック検定*1の一種で、一般に2組の標本について、平均値に有意差があるかどうかを調べる際に用いられます。
t検定は前提からの逸脱に対して比較的堅牢であるとされますが、次のことを前提としています。
2群それぞれの平均を μ1, μ2 とした場合・・
t検定は、少ないサンプル数であっても有意差があるかどうかを判断できるツールとして開発されているため、1つの群につき 6件~10件のデータでも統計処理することが可能です。
平均値の差が同じでも、ばらつき(分散・標準偏差)が異なると、その差が統計的に有意なのか否かが異なります。視覚的なイメージで説明してみましょう。
上の3つのケースでは、いずれも平均の差は同じです。しかし、ばらつきが大きい左のグラフでは2つのサンプルが大きく重なり合っているので集団間の差は偶然である可能性があります。一方、右のグラフのようにばらつきが小さい場合は集団の性質が明らかに異なる・・と言えそうです。一般に、ばらつきが小さいほど、t 値の大きさが大きく、結果 p 値が小さくなります。つまり「差がないと仮定した場合に、めったにおこらない現象が生じている」ということになり、帰無仮説が棄却される = 統計的に有意な差がある・・と判定されます。
分散分析では要因や水準(群)が複数あることを前提に比較を行いますが、t検定は、1つの注目要因について2群の平均値の違いを検定するもので、1要因・2水準で行うのが前提です。
Python 等の環境で t検定を行う場合、一般に「2 つのデータ間に対応がなく、正規性および等分散性が仮定できる」ことを前提に「Student の t検定」が用いられますが、2つの群に等分散性が仮定できない場合は、Welchの方法を採用します(以下のプログラムサンプルに具体的な事例を記載しています)。