LogoMark.png

DataVisualization

可視化

Data Visualization

概要

可視化とは、物事の関係性を視覚的に捉えられるように、データを画像・グラフ・図表などに変換することを言います。その目的は以下のように、データから価値や知恵を生み出すことにあります。

DataInformation(構造化) → Knowledge(知見)→ Wisdom(知恵)


様々なグラフ




Python ビジュアライゼーション


ライブラリの読み込み


データの準備

はじめに対象となるデータをデータフレームとして読み込む必要があります。データの読み込み方法については、Pandas のページをご覧下さい。

df = pd.read_excel('DataSample.xlsx')


ヒストグラム

hist.png

データフレーム(以下 df )からヒストグラムの生成は非常に簡単です。

df.hist() 全項目一挙表示
df["GPA"] .hist( ) 特定カラムの表示


散布図

scatter.png

x軸とy軸にカラム項目を指定して表示します。

df.plot.scatter(x='GPA', y='Attendance')


ボックスプロット

box.png

対象カラム(GPA:成績)を、グループ別(Prefecture:出身県)に分けて表示します。

df.boxplot( column="GPA", by="Prefecture")


棒グラフ

グラフにしたい内容によっては、事前に「データの平均値を出す」、「クロス集計する」といった処理を行って、新しいデータフレーム(表)を作成します。

# 性別ごとに国語・英語・数学の平均値を算出
df_mean = df.groupby("Gender", as_index=False).mean() 
df_mean
GenderJapaneseEnglishMathematics
0F62.35000058.47500039.800000
1M56.42045541.14204539.539773
bar.png

生成された df_mean を使うと、簡単に積み重ね棒グラフができます。

df_mean.plot.bar(stacked=True)




サンプルノート

以下に、Matplotlib を用いたグラフ表示のサンプルを掲載しています。
ipynb(JupyterNotebook)形式で、GitHubに置いていますが、レンダリングがタイムアウトする場合は、下の nbviewer 経由でご覧下さい。




PAGES

GUIDE

DATA

添付ファイル: filebar.png 22件 [詳細] filehist.png 22件 [詳細] filescatter.png 21件 [詳細] filebox.png 17件 [詳細]
Last-modified: 2021-02-11 (木) 19:11:36