LogoMark.png

データサイエンス/02 のバックアップ差分(No.5)


#author("2023-08-29T12:08:20+09:00;2023-08-17T15:24:01+09:00","default:inoue.ko","inoue.ko")
#author("2023-09-01T12:20:58+09:00;2023-08-17T15:24:01+09:00","default:inoue.ko","inoue.ko")
*第2回 統計解析1
[[データサイエンス/2023]]
~

***CONTENTS
#contents2_1
~
~

**要約統計量(記述統計量)
標本の性質を要約するための統計量を「要約統計量」といいます。

-''代表値''(measure of central tendency):データの分布の特徴を表す値
--''平均''(mean):データの総和をデータ数で割った値。最も一般的。
//#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
--中央値(median):データを大きさの順に並べたときに中央にくる値。
--最頻値(mode):度数分布において最も高い度数を示す値。

-''散布度'' (dispersion):データの散らばりぐあいを表す値
--分散(population variance):偏差平方和をデータ数で割った値。
//#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
--''標準偏差''(standard deviation):分散のルートをとった値。
--四分位点:データを昇順に並べたときに、25%, 75% の位置にくる値。


-詳細はこちら >__[[Statistics/Descriptive]]__
//-参考:[[Distribution]]
~
~




**演習2|平均・分散・標準偏差
***XXXXXXXXX
-GoogleDrive > マイドライブ > DataScience に、新規の Spreadsheet を作成してください。
(書きかけです)
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/SSDSE/]]にある「SSDSE-基本素材(SSDSE-E)」を利用します。以下からダウンロードして下さい。
--https://www.nstac.go.jp/sys/files/SSDSE-E-2023.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisetsu-E-2023.pdf

-GoogleDrive > マイドライブ > DataScience に、ダウンロードした基礎データをアップロードして下さい。
-アップしたファイルをダブルクリックすると、ファイルがGoogleスプレッドシートで開かれます。
-''メニュー > ファイル > 「Googleスプレッドシートとして保存」''としてから利用することを推奨します。
~

***要約統計量(記述統計量)の計算
平均や分散等の基本統計量を計算してみましょう。
-元データは、全国の集計行と都道府県の47行あります。
-一番上の「全国」の行を削除、あるいは色分けして、間違って計算対象に含めないように処理して下さい。
-列が多くて(横に長くて)作業しづらい場合は、適当に削除して構いません。
-計算式は、表の下に追加して下さい。
~

***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にします。
 このリンクを知っているインターネット上の全員が閲覧できます。
-3. 「リンクをコピー」をクリックして、そのアドレスを、以下の形式で、学科サイトにリンク掲載して下さい。
 -[[平均・分散・標準偏差>https://docs.google.com/spreadsheets/・・=sharing]]
 -[[要約統計量の計算事例>https://docs.google.com/spreadsheets/・・=sharing]]
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/DataScience
~
~
~
~