#author("2023-08-29T12:08:06+09:00;2023-08-17T15:24:31+09:00","default:inoue.ko","inoue.ko") *第3回 統計解析2 [[データサイエンス/2023]] ~ ***CONTENTS #contents2_1 ~ ~ **相関 //統計処理では、個々の項目の代表値や散布度の把握と並んで、項目間の関係を見出す作業も重要です。Python ではこれを簡単に出力することができます。 // //-共分散 //共分散とは「国語の点数 X」と「数学の点数 Y」のような2組の対応するデータについて「X の偏差 × Y の偏差」の平均 を取った値。 //#mathjax( s_{xy} = \frac{1}{n} \sum_{i=1}^{n}(x_{i}-\bar{x})(y_{i}-\bar{y} ) ) //--共分散の値が正:X が大きいときに Y も大きくなる傾向がある //--共分散の値が 0: X と Y には関係がない //--共分散の値が負:X が大きくなると Y が小さくなる傾向がある // //-相関係数 2つの変数の間の関係を測る指標で、「身長が高い人は体重が大きい」、「数学の点数が高い人は物理の点数も高い」など、「ああであれば、こうである」ということの程度を示します。相関係数 r が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるといいます。 //#mathjax( r = \frac{(xとyの共分散) }{ (xの標準偏差) \times (yの標準偏差) } ) //--&mathjax(r); は -1.0 から +1.0 までのいずれかの値をとる //--&mathjax(| r |); が 1.0 に近いほど相関が強く、0に近いほど相関が弱い レポート等で相関の有無について語る場合、一般的な目安は以下です。 -| r | = 0.7~1.0 かなり強い相関がある -| r | = 0.4~0.7 やや相関あり -| r | = 0.2~0.4 弱い相関あり -| r | = 0~0.2 ほとんど相関なし ~ //~ //**クロス集計 //2つないし3つの情報に限定して、データの分析や集計を行なう方法。 縦軸と横軸に項目を割り振って、項目間の相互関係を視覚的に見やすくしたものです。アンケート調査の手法としては、ポピュラーなものの一つです。 //参考:[[GoogleImage:クロス集計]] //~ -詳細はこちら >__[[Statistics/Descriptive]]__ ~ ~ **演習3|相関係数 ***XXXXXXXXX -GoogleDrive > マイドライブ > DataScience に、新規の Spreadsheet を作成してください。 (書きかけです) ~ ***学科サイトで学科サイトにリンク掲載 (書きかけです) -1. Spreadsheet を開いた状態で、右上の「共有」をクリック -2. 共有設定を変更して、以下のように表示される状態にします。 このリンクを知っているインターネット上の全員が閲覧できます。 -3. 「リンクをコピー」をクリックして、そのアドレスを、以下の形式で、学科サイトにリンク掲載して下さい。 -[[相関係数>https://docs.google.com/spreadsheets/・・=sharing]] -4. 以下のようになればOKです。 https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/DataScience ~ ~ ~ ~ ~ ~