#author("2023-10-10T14:24:59+09:00","default:inoue.ko","inoue.ko") #author("2024-12-19T17:20:30+09:00;2023-10-10T14:24:59+09:00","default:inoue.ko","inoue.ko") *Statistics 実験研究に関わる統計的手法について ~ このページでは、デザイン研究に必要となる「実験」や「調査」について、その統計的手法に関する記事をまとめています。 ~ ***CONTENTS #contents2_1 ~ ~ **はじめに ***統計分析の目的 統計分析の目的は以下の3点に集約することができます。 -データを要約すること -データを生み出す対象(集団)の性質を説明すること -未知のデータ(未来)を予測すること ~ ***統計モデル 現象には、身長・体重・成績など、ばらつきが大きくその実現に不確実性を伴うものと、弾道計算のように初期値が定まれば高い精度で実現結果が予測できるものとがあって、それぞれ現象をモデル化する際の発想が異なります。 -統計モデル:ばらつきのある現象を確率論的なモデルで現象を説明 -数理モデル:微分方程式等の決定論的なモデルで現象を説明 統計手法は、前者の方法で現象をモデル化して説明するもので、確率や確率分布に関する知識が必要になります。 ~ ***記述統計と推測統計 統計には、大きく以下の2つのタイプがあります。 -記述統計:得られたデータのみに注目し、その性質を知る 例:3年A組と3年B組の成績を比較する > 全数調査 -推測統計:標本(サンプル)から、発生元となる母集団の性質を推測する 例:高血圧の人を対象に新薬の効果を検証する > 標本調査 一般に、集団の性質を知るために全てのデータを取ることは不可能であるため、無作為に抽出した「標本から全体を推測する」ことが重要になります。 ~ ~ **母集団と標本 関心の対象となる集団の全体を母集団、母集団から(無作為に)取り出された一部を標本(サンプル)と言います。 ~ ***母集団(Population) 関心の対象となる集団全体のことを「母集団」といい、さらに「有限母集団」と「無限母集団」の区別があります。例えば「日本に住む成人男性」は、その数が有限であることから有限母集団で、一方「さいころを投げて出る目のデータ」などは無限に試行を繰り返すことができることから無限母集団となります。 ~ ***標本(Sample) 母集団の状態を推測するために「抽出」された一部の集団のことを「標本」といいます。関心の対象は母集団なので理想は全数調査ですが、多くの場合、母集団は非常に大きいだけでなく時間とともに変動する存在で、完全に把握することはできません。そこで母集団から抽出した標本に対して統計的解析を行なって母集団を予測するというのが、統計の標準的な手法=推測統計となります。 ~ ***標本サイズと標本数 この2つの言葉は似て非なるものなので、注意が必要です。 -標本サイズ(サンプルサイズ) 標本(サンプル)に含まれる要素の数。例えば、100人に対して行ったアンケートであれば、標本サイズは 100。 n = 100 などと記載します。 -標本数(サンプル数) 標本(サンプル)自体の数。例えば、月〜金まで、毎日30人ずつにアンケートを行って、月曜の分(n = 30)標本A、火曜の分を標本Bなどとした場合、標本数は月〜金で 5 となります。 ~ ~ **変数と尺度 ***変数 統計学では、共通の測定手法で得られた同じ性質をもつデータ値のことを''変数''と言います。例えば、身長、体重、成績(点数)などは変数です。 -データが身長だけの場合を「1変数のデータ」、身長と体重の2つを含むデータであれば「2変数のデータ」と言います。 -変数の数を ''次元'' と呼ぶこともあります。例えば、英語の得点と数学の得点、2つのデータがあれば、横軸を英語、縦軸を数学とした2次元の平面上に個々のデータをプロットすることができます。3次元(3変数)までであれば、変数間の相関を視覚的に把握することができます((変数が多い場合は、変数間の組み合わせをすべて調べるか、「次元落とし(例えば、国・数・英・理を、文系科目と理系科目にまとめる)」を行ってその関係を可視化するなどの方法を採ります。))。 -変数は、''量的変数''と''質的変数''の大きく2つに分類されます。 --量的変数:身長や成績のように変数が''数値''で表されるもの --質的変数:性別、所属学科のように変数が''カテゴリ''として表されるもの ~ ***量的変数 ( 定量的データ, 離散データ / 連続データ) -''比率尺度''(ratio scale)同一性・順序性・加法性・等比性 原点(0)が定まっていて、間隔にも比率にも意味があるもので、和差積商の計算が自由にできるものです。 ''例)''身長、体重、金額、絶対温度など -''間隔尺度''(interval scale)同一性・順序性・加法性 測定対象の差を等間隔の目盛りで評価するもので、その和や差には意味がありますが、比率には意味はありません。 ''例)''知能指数、摂氏の温度、満足度(非常によい:4,よい:3,悪い:2,非常に悪い:1 などで、差項目間の間隔が「均等」とみなされる場合、例えば評定値 4と3の差 と評定値3と3の差が等間隔とみななされる場合)((そもそも、こうした印象評価の段階的な数字は、等間隔である保証はできず、本来であれば順序尺度として扱うものですが、実際の研究では、これを間隔尺度として、統計ソフト等で分析にかけることが多いようです。))。 ~ ***質的変数(定性的データ, カテゴリーデータ ) -''順序尺度''(ordinal scale)同一性・順序性 順序には意味があるが、その間隔には意味がない数値を割り当てたもので、大小の比較は可能ですが、その間隔や比率には意味はありません。 ''例)''ミネラルウォーターの売上BEST10(商品を順に1位、2位、3位・・と割り当てる場合など)、満足度(非常によい:4,よい:3,悪い:2,非常に悪い:1 などで、項目間の間隔が不均等とみなされる場合) -''名義尺度''(nominal scale)同一性 対象を分類するために番号を割り当てたもので、等しいか否かにのみ意味があって、番号の大小には意味のない尺度です。 ''例)''血液型(A型:1,B型:2,・・・,O型:4) ~ ~ **独立変数と従属変数 統計分析では、「何か」の操作が「別の何か」に影響するか(因果関係)、あるいは、「何か」と「別の何か」が連動するか(相関関係)・・など、物事の関係性を分析します。この「何か」のことを一般に「変数」と呼びます。 -''独立変数'' 実験者が操作する変数(原因)。 -''従属変数'' 測定される変数(結果)。 例えば、「鉛筆の軸の太さの違いで、文字の書きやすさが変わるのか」といったことを実験的に確かめたい場合、「太さ」が独立変数で、「書きやすさ」が従属変数となります。 重要なことは、「ああすればこうなる」という原因と結果の関係、あるいは「ああであればこうである」という2者の相関関係を、いかにシャープに検証するかということです。言葉の定義、条件設定、外的要因の制御、科学的な実験では、これらがきちんと設定されていることが大切です。 ~ ***独立変数について さて、ここでいくつかの問題が生じます。まずは独立変数の方です。太さの違う鉛筆を実験材料に選んだとしても、鉛筆には、丸い軸や、6角のものがあり、また表面の塗装、さらに木材の密度も重さに影響するので無視できません。このように実験結果に影響をあたえてしまうような外的要因を「2次変数」といいます。本当に「太さの違い」が原因なのかを調べるためには、以下のような方法で2次変数をコントロールする必要があります。 -2次変数を除去する 可能であればこれがもっとも簡単です。いわゆる実験室というのは、可能な限りこの外的要因を除去したクリーンな場所といえます。 -2次変数を恒常に保つ 除去できないのであれば、次はそれをすべてに対して同一に、あるいはランダムに配分することで、独立変数の効果のみを捉えます。 -独立変数に格上げする 明らかにその要因が結果に影響するという場合、これも重要な変数だということになります。であれば、それを独立変数に格上げして、その効果も測るというのが賢明です。その場合、2つの独立変数の組み合わせ自体が結果に大きく影響する場合もあります(これを交互作用といいます)。 ~ ***従属変数について 問題は従属変数の方にもあります。「書きやすさ」というのは何を基準にすればよいのでしょうか。もちろん、被験者に対してストレートに「書きやすいか」という質問をぶつけて5段階で評価してもらう・・というのもひとつです。「書きやすい」という言葉があるくらいですから、人間が文字を書くときに感じる総合的な感覚としての「書きやすさ」については、言葉どおりに「書きやすいか」という質問も重要です。 一方で、これを別のものさしで測ることも可能です。「書きやすいのであれば、当然同じ文字数を書くのに、スピードが上がるはずだ」という推論ができるのであれば、「この文章をできるだけ早く書いてください」という作業を課し、「太さの違いが作業スピードの差に影響を与えるか」というふうに実験を置き換えることも可能です。 ~ ***交絡因子の除去について 交絡(こうらく confounding)とは、独立変数と従属変数に相関する外部変数の存在・・を意味します。検証したい事項に影響を与える外部変数を、交絡因子(confounding factor、confounder)といって、実証的な研究では、これらの要因を避けるように制御する必要があります。 例えば、食物中の塩分濃度が血圧に与える影響を調べる際は、提供する食物に含まれる塩分以外の要素が、血圧に影響しないよう、シンプルに「塩水」と「真水」で比較する。あるいは、塩分濃度を変えた様々な食材をランダムに提供するなど・・塩分以外の要因が結果に影響しないように制御する必要があります。 ~ ***類似の表現 独立変数と従属変数という用語は、統計ソフトやライブラリーによって、異なる用語が使われる場合があります。以下いずれも同様の用語セットです。 |COLOR(WHITE):BGCOLOR(#333):&mathjax(x);|COLOR(WHITE):BGCOLOR(#333):&mathjax(y);|h |独立変数(independent variable)|従属変数(dependent variable)| |説明変数(explanatory variable)|目的変数(target variable)| |特徴量(feature / attribute)| ラベル(label) | |データ(data)|ターゲット(target)| |予測変数(predictor variable)|応答変数(response variable)| |入力(input)|出力(output)| ~ ~ **記述統計 > ページを独立させました。__[[Statistics/Descriptive]]__ ~ ~ **推測統計 > ページを独立させました。__[[Statistics/Inferential]]__ ~ ~ **ベイズ統計 > ページを独立させました。__[[Statistics/Bayesian]]__ ~ ~ **相関関係と因果関係 私たちが身の回りの観察から見出す物事の「関係」には、「身長が高い人は体重も大きい」など「ああであればこうである」という相関関係(共変動)にあるものと、「気温が上がると清涼飲料水の売上が上がる」など「ああすればこうなる」という因果関係にあるものとがあります。 ~ ***データ解析が見出すのは「相関」 一般に、大量のデータにもとづく統計的な解析や機械学習から得られるのは「相関関係」であって因果関係ではありません。相関関係(共変動)というのは因果関係の前提に過ぎないので、判断や方針決定には注意が必要です。 経験的に観察された共変動は、因果関係の必要条件だが十分条件ではない &small(Edward Tufte); ~ ***誤謬に注意 統計処理によって何らかの関係が見出された場合も、それを結論づける前に、そこに以下のような誤謬((論証の過程に論理的・形式的な瑕疵があって、その論証が妥当でないこと(簡単に言えば「間違っている」)を誤謬と言います。))がないか注意深く検討することが必要です。 -擬似相関(第3の要因が共通原因となっている) 「チョコレートの摂取量」と「ノーベル賞の受賞者数」に正の相関 経済的に豊かであることが両者の共通要因 「小学生の身長」と「論理的思考力」に正の相関 学年が上がることが両者の共通要因 -因果関係の逆転 交番の数が多い地域ほど、犯罪件数が多い 犯罪件数が多い地域だから交番が多く設置された 猫が顔を洗うと雨が降る 雨が降る前の湿度上昇が、センサーであるひげを拭う行為を誘発 -偶然 スマートフォンの普及が、地球温暖化を促進 テクノロジーの進歩と経済活動の拡大という共通の要因、あるいは偶然 //-直接的な関係の存在 // 圧力の上昇が、温度を上昇させる //両者はもともと直接的な比例関係にあって、独立していない ~ ~ **多変量解析 > ページを独立させました。__[[Statistics/MultivariateAnalysis]]__ ~ ~ **統計ツール ***Python言語 [[Python]]はさまざまな分野のアプリケーションで使われているインタープリタ型のプログラミング言語ですが、統計ツールとしてのパッケージが充実しており、統計学習における重要なツールのひとつに位置付けられます。 -__[[Python]]__ -Python 公式サイト https://www.python.org/ -開発環境 anaconda 公式サイト https://www.anaconda.com/ -開発環境 Google Colaboratory 公式サイト https://colab.research.google.com -データ解析/分析に関わるライブラリ > [[Python#Library]] ~ ***Orange 簡単なGUI操作で[[データマイニング>DataMining]]ができるオープンソースのソフトウエア。[[Python]] の開発環境 [[Anaconda>https://www.anaconda.com/]]を導入して、そこに追加すると便利です。 -__[[Orange]]__ -https://orange.biolab.si/ -https://orange.biolab.si/screenshots/ ~ ***GNU R(R言語) オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境です。一見地味なのですが、すごく優秀なソフトで、統計関係の書籍もたくさん出ています。インストールする場合、まずR本体のインストールをして(これだけでも仕事はできます)、そのあと R-Studio のインストール、という手順になります。 -R本体 --https://cran.r-project.org/ --http://www.statistics.co.jp/reference/software_R/free_software-R.htm -統合開発環境 R-Studio --https://www.rstudio.com/ -Wikipedia R:https://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E -Rの使い方:https://sites.google.com/site/webtextofr/home -R-tips:http://cse.naro.affrc.go.jp/takezawa/r-tips/r2.html ~ ***エクセル統計 Excelのメニューに統計解析の手法を追加するアドインソフトです。 一般企業や官公庁むけの通常版と、学校法人等に属する学生、教職員むけのアカデミック版の2種類の価格があります。 https://bellcurve.jp/ex/ ~ ***SAS University Edition 高等教育機関や社会人の学習者向けに提供される無償ソフトウェアです。 PC、Mac、Linuxで利用できます。 https://www.sas.com/ja_jp/software/university-edition.html ~ ***SPSS(IBM) 計画およびデータ収集から分析、レポート作成、実装までの分析プロセス全体に対応したソフトウェアの統合ファミリーです。 http://www-01.ibm.com/software/jp/marketplace/spss/ ~ ~ **付記 ***教育効果は測れない? 例えば「投薬の効果」のようなものであれば、実験群(投薬)と対照群(偽薬)を、被験者に偏りがないよう、ランダムに振り分けてつくることができますが(RCT:ランダム化比較実験)、''社会科学では、そもそも実験群と対照群を厳密に用意することができません''。例えば「ある教育手法の効果」を計るのに、生徒100人をランダムに振り分けて比較するということは難しく、同レベルの学校を2つ選んで比較したとしても、実験群と対照群には教師の違い他、様々な違いが存在するので、結果が当該手法の効果であるとは言い切れないのです。 また、[[因果推論>Google:因果推論]]の根本問題として「同一人物の異なるケースの経過観察」は不可能です。''時を戻す''ことができれば「実施した場合」と「実施しなかった場合」の厳密な比較ができますが、それは現実には不可能です。 ちなみに、人と社会を相手にして「因果効果を測る」という、この難しい課題に取り組む手法として、以下のようなマッチング手法((マッチング手法とは、''変数の統制が不可能な社会科学分野''において、疑似的に実験研究と同様の状態を作り出す手法で、因果効果を推定するための重要な手法だと言われます。))があります。 -[[傾向スコアマッチング(PSM:Propensity Score Matching)>Google:傾向スコア]] // 参考文献:日本の公教育 ~ ***予言の自己成就・予言の自己破綻 統計データの分析結果は、社会現象の予測については、必ずしも有効な手段ではありません。社会学や社会心理学でよく話題になる「予言の自己成就」と「予言の自己破綻」について知っておくことが必要です。それぞれ身近な事例で説明します。 -''予言の自己成就'' 「A高校とB高校では、A高校の方が教育の質が高い」という予言が流布したとすると、実際には教育の質に差がなかったとしても、A高校の方に高学力の志願者が集中し、結果「質が高い」という予測が成就する。これは教育の質に差がなくても、結果としてそう見える・・という現象です。 -''予言の自己破綻'' 「A高校とB高校では、A高校の志願者が増える」という予言が流布したとすると、競争倍率の高さで不合格になることを回避するために、B高校の志願者が増える・・予言とは逆のことが起きる現象です。 ~ ***実証主義と反証主義 なぜ「帰無仮説を棄却する」などいうまわりりくどい論理を使うのか。これは仮説検定だけではなく、科学的な方法論一般にみられるものです。 たとえば「青い鳥が存在する」という「特称命題」は、それを一匹見つければ証明できますが、「すべての鳥は青い」という「全称命題」を実証するためには、地球上のすべての鳥を観察して、全部青いことを示さなければなりません。これは不可能です。しかしこれを反証するためには、青くない鳥を一匹見つけるだけで済むのです。実証と反証では、圧倒的に反証の方がしやすいのです。 ~ ~ **APPENDIX ***関連ページ -[[Statistics]] --[[Statistics/Descriptive]] --[[Statistics/Inferential]] --[[Statistics/Probability]] --[[Statistics/UniformDistribution]] --[[Statistics/BinomialDistribution]] --[[Statistics/PoissonDistribution]] --[[Statistics/NormalDistribution]] --[[Statistics/ExponentialDistribution]] --[[Statistics/HypothesisTesting]] --[[Statistics/Bayesian]] --[[Statistics/MultivariateAnalysis]] -[[DataScience]] -[[ArtificialIntelligence]] -[[ArtificialIntelligence/Links]] -[[Data]] -[[Statistics]] -[[DataVisualization]] -[[MachineLearning]] --[[DecisionTree]] --[[k-means]] --[[LinearRegression]] --[[LogisticRegression]] --[[MultipleCorrespondenceAnalysis>Statistics/MCA]] --[[NeuralNetwork]] --[[PrincipalComponentAnalysis>Statistics/PCA]] --[[RandomForest]] --[[SupportVectorMachine]] -[[DataMining]] -[[Python]] --[[Pandas]] --[[scikit-learn]] -[[GoogleColaboratory]] -[[Orange]] -[[OpenData]] ~ ***参考になるサイト -統計Web:https://bellcurve.jp/statistics/course/ -統計学習補助教材:https://www.stat.go.jp/teacher/comp-learn-04.html ~ ~ ~