可視化
Data Visualization
概要
可視化とは、物事の関係性を視覚的に捉えられるように、データを画像・グラフ・図表などに変換することを言います。代表的なのは「散布図」です。
用語解説
- 散布図:縦軸、横軸に変数を対応させて、データを点でプロットしたもの
- ヒストグラム:縦軸に度数、横軸に項目を対応させ、事項間の度数を比較するもの。度数分布図、柱状グラフともいう。
- 円グラフ:円図形を扇形に分割し、事項の構成比率を表すもの
- 箱ひげ図:データのばらつきを、箱(box)と、その両側に出たひげ(whisker)で表現する図。特に品質管理でよく用いられる。
プログラム例
以下に、Matplotlib を用いたグラフ表示のサンプルを掲載しています。
ipynb(JupyterNotebook)形式で、GitHubに置いていますが、レンダリングがタイムアウトする場合は、下の nbviewer 経由でご覧下さい。
- 1. 数式(乱数を含む)により生成したデータの可視化
- GitHub:DataVisualization01.ipynb
- nbviewer:DataVisualization01.ipynb
- 2. 統計サンプル irisデータの可視化
- GitHub:DataVisualization02.ipynb
- nbviewer:DataVisualization02.ipynb
- 使用したライブラリ
- numpy(数値計算)
- pandas(データ解析)
- matplotlib(グラフ描画)
- seaborn(ビジュアライゼーション)