LogoMark.png

データサイエンス/08 のバックアップソース(No.6)

#author("2023-08-30T17:34:51+09:00","default:inoue.ko","inoue.ko")
*第7回 Python によるデータ解析2
[[データサイエンス/2023]]
~

***CONTENTS
#contents2_1
~
~


**仮設検定について
仮説検定とは、母集団分布の母数に関する仮説を標本から検証する統計学的方法の一つで、例えば「従来製品の電力消費量の平均値と、新製品の電力消費量の平均値には、統計的に有意な差がある」といった仮説を検証する際に用いられます。詳細について、以下のページで概説します。
-__[[仮設検定>Statistics/HypothesisTesting]]__

//-__[[t検定>Statistics/t-test]]__
//-__[[Statistics/ANOVA]]__
//-__[[Statistics/χ-Squared-test]]__




~
~


**演習7|仮設検定
今回の演習では、検定の定番とも言える ''t検定''の事例を紹介します。2つのグループ間の平均値に差があるか否かについて、「対応なし」と「対応あり」の2つのパターンを試します。

汎用性の高い事例となるように、CSVデータを読み込んでから、検定に使えるデータに加工するという手順を踏んでいます。

このサンプルを参考に、自分でも様々なデータを使って検定を行なってみてください。 異なる条件が与えられた2つのグループ間に「差がある」ということがわかるだけで、学術論文が書けます。

~

***サンプルデータの事前確認
この演習では、以下のデータをサンプルとして利用します。GitHubから直接読み込むので、ダウンロードの必要はありません。

-iris.csv
https://raw.githubusercontent.com/koichi-inoue/DataScience/main/iris.csv
Irisは、データサイエンスの分野で最も有名なデータサンプルのひとつです。Irisは日本語で「アヤメ」。このデータセットには、setosa、versicolor、virginicaという3種の花に着目して、がく片(sepal)の長さ・幅、および花弁(petal)の長さ・幅、それぞれ 50個の測定結果が含まれています。    

-sleep.csv
https://raw.githubusercontent.com/koichi-inoue/DataScience/main/sleep.csv
薬剤1と薬剤2の2種類の睡眠薬を10人の被験者に投与した際の、睡眠時間の差分を記録したデータで、2種類の薬剤を同一被験者に投与していることから、その値には対応があるといえます。
~

***ノートブックの新規作成
-__[[Google Colaboratory>https://colab.research.google.com]]__ でノートブックを新規作成
-Untitled0.ipynb というファイル名を変更 > t-test.ipynb
~


***サンプルコード
-''JupyterNotebook形式(.ipynb)でサンプルプログラムを提供します。''
&fontawesome(far fa-hand-point-right); __[[t_test.ipynb>https://github.com/koichi-inoue/DataScience/blob/main/t_test.ipynb]]__(GitHub に置いています)
プログラムの解説付きのノートになっているので、このページの上から順に、テキストとコードを自分のノートに書く、あるいは、コピー&ペーストして、お試しください。
 In [ ]:コード部分です。これを自分のノート のコードブロックに書く
 Out [ ]:実行結果です。コードを実行すると表示されます。
 説明文:必要に応じて、自分自身のノートとして記載して下さい。

-t検定には、統計ライブラリ__[[scipy>https://scipy.org/]]__ の、以下の2つの関数を使っています。
--scipy.stats.ttest_ind 対応のない2標本の t検定
--scipy.stats.ttest_rel 対応のある2標本の t検定

~

***学科サイトにリンク掲載
ノートを、学科サイトの個人ページからリンクして下さい。以下、手順です。

-1. 自分のノートを開いた状態で、右上の「共有」をクリック

-2. 共有設定を変更して、以下のように表示される状態にします。
 このリンクを知っているインターネット上の全員が閲覧できます。

-3. 「リンクをコピー」をクリックして、そのアドレスを、以下の形式で、学科サイトの「Jupyter Notebooks」の部分に掲載して下さい。
 -[[xxxxxxxxxxxxx>https://colab.research.go・・=sharing]]

-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/DataScience
~
~

***関連リンク
-対応のない2標本t検定(統計Web)
https://bellcurve.jp/statistics/course/9446.html
-対応のある2標本t検定(統計Web)
https://bellcurve.jp/statistics/course/9453.html
~
~
~
~