LogoMark.png

データサイエンス/02 のバックアップソース(No.2)

#author("2023-08-17T11:22:12+09:00","default:inoue.ko","inoue.ko")
*第2回 統計解析1
[[データサイエンス/2023]]
~

***CONTENTS
#contents2_1
~
~

**要約統計量(記述統計量)
標本の性質を要約するための統計量を「要約統計量」といいます。Python では、これを一行のコードで一覧出力することができます。

-''代表値''(measure of central tendency):データの分布の特徴を表す値
--''平均''(mean):データの総和をデータ数で割った値。最も一般的。
//#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
--中央値(median):データを大きさの順に並べたときに中央にくる値。
--最頻値(mode):度数分布において最も高い度数を示す値。

-''散布度'' (dispersion):データの散らばりぐあいを表す値
--分散(population variance):偏差平方和をデータ数で割った値。
//#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
--''標準偏差''(standard deviation):分散のルートをとった値。
--四分位点:データを昇順に並べたときに、25%, 75% の位置にくる値。

//-参考:[[Distribution]]
~
~

**SpreadSheet で体験
(書きかけです)


~
~