#author("2023-08-17T11:22:12+09:00","default:inoue.ko","inoue.ko") *第2回 統計解析1 [[データサイエンス/2023]] ~ ***CONTENTS #contents2_1 ~ ~ **要約統計量(記述統計量) 標本の性質を要約するための統計量を「要約統計量」といいます。Python では、これを一行のコードで一覧出力することができます。 -''代表値''(measure of central tendency):データの分布の特徴を表す値 --''平均''(mean):データの総和をデータ数で割った値。最も一般的。 //#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i) --中央値(median):データを大きさの順に並べたときに中央にくる値。 --最頻値(mode):度数分布において最も高い度数を示す値。 -''散布度'' (dispersion):データの散らばりぐあいを表す値 --分散(population variance):偏差平方和をデータ数で割った値。 //#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 ) --''標準偏差''(standard deviation):分散のルートをとった値。 --四分位点:データを昇順に並べたときに、25%, 75% の位置にくる値。 //-参考:[[Distribution]] ~ ~ **SpreadSheet で体験 (書きかけです) ~ ~