LogoMark.png

Statistics/t-test のバックアップ(No.5)


t 検定

Student's t-test



概要

t検定(t-test)とは、統計量が t分布に従うことを前提とするパラメトリック検定*1の一種で、一般に2組の標本について、平均値に有意差があるかどうかを調べる際に用いられます。

前提

t検定は前提からの逸脱に対して比較的堅牢であるとされますが、次のことを前提としています。

帰無仮説・対立仮説

2群それぞれの平均を μ1, μ2 とした場合・・

用語解説

要因と水準

分散分析では要因や水準(群)が複数あることを前提に比較を行いますが、t検定は、1つの注目要因について2群の平均値の違いを検定するもので、1要因・2水準で行うのが前提です。

t 検定の種類

Python 等の環境で t検定を行う場合、一般に「2 つのデータ間に対応がなく、正規性および等分散性が仮定できる」ことを前提に「Student の t検定」が用いられますが、2つの群に等分散性が仮定できない場合は、Welchの方法を採用します(以下のプログラムサンプルに具体的な事例を記載しています)。



サンプルプログラム

正規乱数で2群のデータを作って、t検定を行うサンプルです。
https://github.com/koichi-inoue/JupyterNotebook/blob/master/t_test.ipynb