第2回 統計解析1
データサイエンス/2023?
CONTENTS
要約統計量(記述統計量)
標本の性質を要約するための統計量を「要約統計量」といいます。Python では、これを一行のコードで一覧出力することができます。
- 代表値(measure of central tendency):データの分布の特徴を表す値
- 平均(mean):データの総和をデータ数で割った値。最も一般的。
- 中央値(median):データを大きさの順に並べたときに中央にくる値。
- 最頻値(mode):度数分布において最も高い度数を示す値。
- 散布度 (dispersion):データの散らばりぐあいを表す値
- 分散(population variance):偏差平方和をデータ数で割った値。
- 標準偏差(standard deviation):分散のルートをとった値。
- 四分位点:データを昇順に並べたときに、25%, 75% の位置にくる値。
SpreadSheet で体験
(書きかけです)