#author("2023-09-01T12:20:58+09:00;2023-08-17T15:24:01+09:00","default:inoue.ko","inoue.ko") *第2回 統計解析1 [[データサイエンス/2023]] ~ ***CONTENTS #contents2_1 ~ ~ **要約統計量(記述統計量) 標本の性質を要約するための統計量を「要約統計量」といいます。 -''代表値''(measure of central tendency):データの分布の特徴を表す値 --''平均''(mean):データの総和をデータ数で割った値。最も一般的。 //#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i) --中央値(median):データを大きさの順に並べたときに中央にくる値。 --最頻値(mode):度数分布において最も高い度数を示す値。 -''散布度'' (dispersion):データの散らばりぐあいを表す値 --分散(population variance):偏差平方和をデータ数で割った値。 //#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 ) --''標準偏差''(standard deviation):分散のルートをとった値。 --四分位点:データを昇順に並べたときに、25%, 75% の位置にくる値。 -詳細はこちら >__[[Statistics/Descriptive]]__ //-参考:[[Distribution]] ~ ~ **演習2|平均・分散・標準偏差 ***サンプルデータの準備 -[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/SSDSE/]]にある「SSDSE-基本素材(SSDSE-E)」を利用します。以下からダウンロードして下さい。 --https://www.nstac.go.jp/sys/files/SSDSE-E-2023.xlsx --データの解説:https://www.nstac.go.jp/sys/files/kaisetsu-E-2023.pdf -GoogleDrive > マイドライブ > DataScience に、ダウンロードした基礎データをアップロードして下さい。 -アップしたファイルをダブルクリックすると、ファイルがGoogleスプレッドシートで開かれます。 -''メニュー > ファイル > 「Googleスプレッドシートとして保存」''としてから利用することを推奨します。 ~ ***要約統計量(記述統計量)の計算 平均や分散等の基本統計量を計算してみましょう。 -元データは、全国の集計行と都道府県の47行あります。 -一番上の「全国」の行を削除、あるいは色分けして、間違って計算対象に含めないように処理して下さい。 -列が多くて(横に長くて)作業しづらい場合は、適当に削除して構いません。 -計算式は、表の下に追加して下さい。 ~ ***学科サイトで学科サイトにリンク掲載 -1. Spreadsheet を開いた状態で、右上の「共有」をクリック -2. 共有設定を変更して、以下のように表示される状態にします。 このリンクを知っているインターネット上の全員が閲覧できます。 -3. 「リンクをコピー」をクリックして、そのアドレスを、以下の形式で、学科サイトにリンク掲載して下さい。 -[[要約統計量の計算事例>https://docs.google.com/spreadsheets/・・=sharing]] -4. 以下のようになればOKです。 https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/DataScience ~ ~ ~ ~