Student's t-test
t検定(t-test)とは、統計量が t分布に従うことを前提とするパラメトリック検定*1の一種で、一般に2組の標本について、その平均値に「統計的な有意差」があるかどうかを調べる際に用いられます。
例えば、血圧を下げる新薬の効果測定のために、同一被験者群に対して、実際の投薬を行なった日と偽薬を投薬した日をそれぞれ第1群、第2群とすることで、血圧降下量の平均値比較する場合。
*サンプルサイズ(被験者数)は同一であることが前提です。
例えば、同様の新薬の効果を確認するために、異なる被験者グループに対して、一方には実際に投薬を行い、他方には偽薬を投薬して、投薬後の血圧降下量の平均値を比較する場合。これは2群間で被験者の健康状態等に偏りがないことが必須で、少人数の実験では、本当に当該医薬品の効果なのか、それとも被験者の持つ別の要因が関係しているのかは見極めにくいという問題があります。
*サンプルサイズ(被験者数)は異なっても構いません。
母集団の平均値 μ が特定の値 μ0 と等しいか否かを検定する際に使用します。
t検定は前提からの逸脱に対して比較的堅牢であるとされますが、次のことを前提としています。
2群それぞれの母集団平均を
2群を比較する t検定における統計量には、t分布を表す以下の式を応用します。
上の式において、標本平均
2つの群の母集団が同一であれば、標本平均の差
平均値の差が同じでも、ばらつき(分散・標準偏差)が異なると、その差が統計的に有意なのか否かが異なります。視覚的なイメージで説明してみましょう。
上の3つのケースでは、いずれも平均の差は同じです。しかし、ばらつきが大きい左のグラフでは2つのサンプルが大きく重なり合っているので、その差は偶然(誤差の範囲内)である可能性があります。一方、右のグラフのようにばらつきが小さい場合は集団の性質が明らかに異なると言えそうです。一般に、ばらつきが小さいほど、t 値の値が大きく、結果 p 値が小さくなります。つまり「差がないと仮定した場合に、めったにおこらない現象が生じている」ということになり、帰無仮説が棄却される = 統計的に有意な差がある・・と判定されます。
t検定は、少ないサンプル数であっても有意差があるかどうかを判断できるツールとして開発されているため、1つの群につき 6件~10件のデータでも統計処理することが可能です。
Python 等の環境で t検定を行う場合、一般に「2 つのデータ間に対応がなく、正規性および等分散性が仮定できる」ことを前提に「Student の t検定」が用いられます*2。(以下のプログラムサンプルに具体的な事例を記載しています)。