データサイエンス/2021/1126
をテンプレートにして作成
LECTURE
担当科目一覧
ソーシャルデザイン概論/2022
ソーシャルデザイン演習/2022
情報デザイン論/2022
情報デザイン演習IIA/2022
情報デザイン研究I/2022
卒業研究I,II
KEYWORDS
WEB DESIGN
SOCIAL DESIGN
SQUARES
LINKS
九州産業大学
芸術学部
芸術研究科
九産大美術館
九産大図書館
年間スケジュール
動画ニュース他
交通情報
気象・環境情報
危機に備えて
K'sLife
Office365Mail
Tools
SEARCH
開始行:
*第11回 データビジュアライゼーション1
[[データサイエンス/2021]]|''2021.11.26''
~
***AGENDA
-以下名簿が表示されます。出欠確認・座席記録をお願いします。
&fontawesome(far fa-hand-point-right); [[出欠確認・座席...
-講義はこのページの内容を解説するかたちで遠隔 LIVE 配信し...
-質問等は YouTubeLive のチャットまたは LINEの 20ASグルー...
-学科サイトの各自のページを更新して下さい。
&fontawesome(far fa-hand-point-right); [[学科サイト|受...
~
#hr
'''''以下、LIVE動画をご覧下さい。記事に沿って解説します。...
記録動画は後日、[[学科サイトの特設ページ(要ログイン)>ht...
#hr
~
#youtube(ewv8ZKG7Gi0)
https://youtu.be/ewv8ZKG7Gi0
//埋め込み無効状態です。授業開始直前にページをリロードし...
~
-配信開始:2021.11.26 09:00 -
-動画は授業直前に有効になります(準備段階では黒い画面)。...
~
***CONTENTS
#contents2_1
~
~
**はじめに
***進捗確認
-第8回 %%データサイエンスとPython%% 演習1, 2
-第9回 %%Python によるデータ解析1(GitHub CSV)%% 演...
-第10回 %%Python によるデータ解析2(GoogleDrive Excel...
-第11回 ''Python によるデータビジュアライゼーション1''...
-第12回 Python によるデータビジュアライゼーション2
-第13回 Python によるデータビジュアライゼーション3
-第14回 機械学習・序説
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
**Pythonによるデータ解析について
ある程度、利用に慣れてきたところで、多少専門的なお話を補...
~
***Python について
> [[Python]]
~
***Python データ解析ライブラリ Pandas について
> [[Pandas]]
~
***オブジェクト指向プログラミングについて
-[[ObjectOrientedProgramming]]
-https://www.w3schools.com/js/js_objects.asp
~
~
**データビジュアライゼーション
データビジュアライゼーション(Data Visualization)とは、...
''Data'' → ''Information''(構造化)→ ''Knowledge''(知見...
~
***様々なグラフ
-[[ヒストグラム>GoogleImage:ヒストグラム]]:縦軸に度数、...
-[[ボックスプロット(箱ひげ図)>GoogleImage:箱ひげ図]]:...
-[[散布図>GoogleImage:散布図]]:縦軸、横軸に変数を対応さ...
-[[折れ線グラフ>GoogleImage:折れ線グラフ]]:時系列の推移...
-[[棒グラフ>GoogleImage:棒グラフ]]:項目間の値を比較する...
-[[円グラフ>GoogleImage:円グラフ]]:円図形を扇形に分割し...
-[[ヒートマップ>GoogleImage:ヒートマップ]]:2次元データの...
~
***Topics
#image(https://upload.wikimedia.org/wikipedia/commons/thu...
-__[[ナイチンゲールの鶏頭図>GoogleImage:ナイチンゲール 鶏...
クリミア戦争における月別の死因を可視化したもの。赤色が負...
&scale(75){出典:https://commons.wikimedia.org/wiki/File:...
~
-__[[データインク比>GoogleImage:Data-ink ratio]]__
エドワード・タフテによる「良いグラフィック」の指標で、「...
Data-ink ratio = Data-ink / total ink used to print ...
&scale(75){Edward Tufte, 1992, The Visual Display of Quan...
~
~
**Python によるビジュアライゼーション
Pythonを用いたデータビジュアライゼーションには、様々な関...
~
***基本データ処理用のライブラリ
//-[[numpy>https://numpy.org/]]|数値計算
// import numpy as np
//
-[[pandas>Pandas]]|データフレームの活用
import pandas as pd
//
//-[[janome>https://mocobeta.github.io/janome/]]|日本語...
// import janome
~
***ビジュアライゼーション用のライブラリ
-[[matplotlib>https://matplotlib.org/]]|グラフ描画の基本...
import matplotlib.pyplot as plt
-[[seaborn>https://seaborn.pydata.org/]]|matplotlib をベ...
import seaborn as sns
-[[folium>https://python-visualization.github.io/folium/]...
import folium
from folium.plugins import HeatMap
-[[plotly>https://plotly.com/python/]]|動的グラフ作成
import plotly.graph_objects as go
import plotly.express as px
-[[wordcloud>https://amueller.github.io/word_cloud/]]|ワ...
-[[pillow>https://pillow.readthedocs.io/]]|画像処理
~
~
**Pythonによる統計グラフ
今回は matplotlib と pandas の連携による基本的なグラフ描...
~
***データの準備
統計グラフの作成には、対象となるデータを''データフレーム'...
df = pd.read_csv( '/path/to/xxxxx.csv' )
~
***ヒストグラム
#image(Pandas/hist.png,right,30%)
ヒストグラム(柱状グラフ、度数分布図)は、横軸に階級、縦...
データフレームからヒストグラムを生成するコードは非常に簡...
df.hist( ) 全項目一挙表示
df[ 'XXX' ] .hist( ) 特定カラムの表示
&small(df はデータフレーム変数の例です。);
~
***ボックスプロット
#image(Pandas/box.png,right,30%)
ボックスプロット(箱ひげ図)は、データのばらつきを可視化...
一般に以下の五数が要約(five-number summary)されて表示さ...
-最小値(minimum)
-第1四分位点(lower quartile)
-中央値(第2四分位点、median)
-第3四分位点(upper quartile)
-最大値(maximum)
以下のコードは、対象カラム(XXX)をグループ(AAA)別に表...
df.boxplot( column='XXX' , by='AAA' )
~
***散布図
#image(Pandas/scatter.png,right,30%)
散布図(scatter plot)は、縦軸、横軸に2つの量的データ項...
以下のコードは、x軸とy軸にカラム項目を指定して表示します。
df.plot.scatter( x='XXX', y='YYY' )
~
***折れ線グラフ・棒グラフ・円グラフ
これらのグラフは項目間の推移や比較を見るために使います。...
# 性別ごとに国語・英語・数学の平均値を算出
df_mean = df.groupby( 'Gender' , as_index=False ).mean( )
df_mean
||Gender|Japanese|English|Mathematics|h
|0|F|62.350000|58.475000|39.800000|
|1|M|56.420455|41.142045|39.539773|
#image(Pandas/bar.png,right,30%)
生成された df_mean を使うと、簡単に積み重ね棒グラフができ...
df_mean.plot.bar( stacked=True )
&small(stacked=True は、積み重ねを有効にする・・という意...
~
~
**Pythonによる統計グラフの描画体験
CSVデータから統計量を視覚化するサンプルです。matplotlib ...
~
***ノートブックの新規作成
-__[[Google Colaboratory>https://colab.research.google.co...
-Untitled0.ipynb というファイル名を変更 > StatisticalGra...
~
***サンプルデータ
第9回と同じ Tips のデータをサンプルとして利用します。
直接読み込むので、ダウンロードの必要はありません。
https://github.com/mwaskom/seaborn-data/blob/master/tips....
//https://raw.githubusercontent.com/mwaskom/seaborn-data/...
~
***サンプルコード
JupyterNotebook形式(.ipynb)でプログラムを提供します。
https://github.com/koichi-inoue/DataScience/blob/main/Sta...
~
~
~
**プログラムの解説
***ライブラリーの読み込み
冒頭で、グラフ描画用のライブラリー''matplotlib''とデータ...
# matplotlib パッケージ から pyplot モジュールを plt と...
import matplotlib.pyplot as plt
# pandasライブラリの読み込み
import pandas as pd
~
***ヒストグラム・ボックスプロット・散布図
-ヒストグラム(度数分布) hist
以下の1行で、データフレームに含まれる「量的データ」すべ...
df.hist()
以下の一行で、グラフを表示します。この1行は書かなくても...
plt.show()
-ボックスプロット(箱ひげ図) boxplot
以下の一行で曜日ごとのチップの額に関するボックスプロット...
df.boxplot( column = 'tip', by = 'day' , figsize = ( 9, ...
figsize はノート上に表示されるグラフの幅と高さを指定して...
-散布図 plot.scatter
以下の一行で「総支払い額」と「チップ」の散布図が表示され...
df.plot.scatter( x = 'total_bill' , y = 'tip' , figsize ...
alpha は点をプロットする際の「不透明度」を意味します。
~
***棒グラフ・折れ線グラフ・円グラフ
-事前のデータ処理
折れ線グラフ、棒グラフ、円グラフでは、全てのデータを可視...
df2 = df.groupby( 'day' ).mean()
df2
-indexの並べ替え
データフレームを処理すると、項目がアルファベット順に出力...
df3 = df2.reindex( index = [ 'Thur', 'Fri', 'Sat' , 'Sun...
df3
-折れ線グラフ plot
以下の一行で量的データ項目の折れ線グラフが表示されます。...
df3.plot( figsize = ( 9, 6 ) )
-棒グラフ plot.bar
以下の一行で量的データ項目の棒グラフが表示されます。
df3.plot.bar( figsize = ( 9 , 6 ) )
-積み重ね棒グラフ
以下の一行で総支払額とチップの積み重ね棒グラフが表示され...
df3[ ['total_bill' , 'tip'] ].plot.bar( stacked=True , f...
-円グラフ plot.pie
以下の一行で量的データ項目の曜日構成比が円グラフとして表...
df3.plot.pie( subplots = True , figsize = (12,6) )
~
~
**学科サイトにリンク掲載(その5)
ノートを、学科サイトの個人ページからリンクして下さい。以...
-1. 自分のノートを開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[StatisticalGraphics1>https://colab.research.go・・=sh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
**APPENDIX
***数理グラフ
数式等を用いたグラフ表示のサンプルです。時間に余裕のある...
https://github.com/koichi-inoue/DataScience/blob/main/Plo...
~
~
終了行:
*第11回 データビジュアライゼーション1
[[データサイエンス/2021]]|''2021.11.26''
~
***AGENDA
-以下名簿が表示されます。出欠確認・座席記録をお願いします。
&fontawesome(far fa-hand-point-right); [[出欠確認・座席...
-講義はこのページの内容を解説するかたちで遠隔 LIVE 配信し...
-質問等は YouTubeLive のチャットまたは LINEの 20ASグルー...
-学科サイトの各自のページを更新して下さい。
&fontawesome(far fa-hand-point-right); [[学科サイト|受...
~
#hr
'''''以下、LIVE動画をご覧下さい。記事に沿って解説します。...
記録動画は後日、[[学科サイトの特設ページ(要ログイン)>ht...
#hr
~
#youtube(ewv8ZKG7Gi0)
https://youtu.be/ewv8ZKG7Gi0
//埋め込み無効状態です。授業開始直前にページをリロードし...
~
-配信開始:2021.11.26 09:00 -
-動画は授業直前に有効になります(準備段階では黒い画面)。...
~
***CONTENTS
#contents2_1
~
~
**はじめに
***進捗確認
-第8回 %%データサイエンスとPython%% 演習1, 2
-第9回 %%Python によるデータ解析1(GitHub CSV)%% 演...
-第10回 %%Python によるデータ解析2(GoogleDrive Excel...
-第11回 ''Python によるデータビジュアライゼーション1''...
-第12回 Python によるデータビジュアライゼーション2
-第13回 Python によるデータビジュアライゼーション3
-第14回 機械学習・序説
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
**Pythonによるデータ解析について
ある程度、利用に慣れてきたところで、多少専門的なお話を補...
~
***Python について
> [[Python]]
~
***Python データ解析ライブラリ Pandas について
> [[Pandas]]
~
***オブジェクト指向プログラミングについて
-[[ObjectOrientedProgramming]]
-https://www.w3schools.com/js/js_objects.asp
~
~
**データビジュアライゼーション
データビジュアライゼーション(Data Visualization)とは、...
''Data'' → ''Information''(構造化)→ ''Knowledge''(知見...
~
***様々なグラフ
-[[ヒストグラム>GoogleImage:ヒストグラム]]:縦軸に度数、...
-[[ボックスプロット(箱ひげ図)>GoogleImage:箱ひげ図]]:...
-[[散布図>GoogleImage:散布図]]:縦軸、横軸に変数を対応さ...
-[[折れ線グラフ>GoogleImage:折れ線グラフ]]:時系列の推移...
-[[棒グラフ>GoogleImage:棒グラフ]]:項目間の値を比較する...
-[[円グラフ>GoogleImage:円グラフ]]:円図形を扇形に分割し...
-[[ヒートマップ>GoogleImage:ヒートマップ]]:2次元データの...
~
***Topics
#image(https://upload.wikimedia.org/wikipedia/commons/thu...
-__[[ナイチンゲールの鶏頭図>GoogleImage:ナイチンゲール 鶏...
クリミア戦争における月別の死因を可視化したもの。赤色が負...
&scale(75){出典:https://commons.wikimedia.org/wiki/File:...
~
-__[[データインク比>GoogleImage:Data-ink ratio]]__
エドワード・タフテによる「良いグラフィック」の指標で、「...
Data-ink ratio = Data-ink / total ink used to print ...
&scale(75){Edward Tufte, 1992, The Visual Display of Quan...
~
~
**Python によるビジュアライゼーション
Pythonを用いたデータビジュアライゼーションには、様々な関...
~
***基本データ処理用のライブラリ
//-[[numpy>https://numpy.org/]]|数値計算
// import numpy as np
//
-[[pandas>Pandas]]|データフレームの活用
import pandas as pd
//
//-[[janome>https://mocobeta.github.io/janome/]]|日本語...
// import janome
~
***ビジュアライゼーション用のライブラリ
-[[matplotlib>https://matplotlib.org/]]|グラフ描画の基本...
import matplotlib.pyplot as plt
-[[seaborn>https://seaborn.pydata.org/]]|matplotlib をベ...
import seaborn as sns
-[[folium>https://python-visualization.github.io/folium/]...
import folium
from folium.plugins import HeatMap
-[[plotly>https://plotly.com/python/]]|動的グラフ作成
import plotly.graph_objects as go
import plotly.express as px
-[[wordcloud>https://amueller.github.io/word_cloud/]]|ワ...
-[[pillow>https://pillow.readthedocs.io/]]|画像処理
~
~
**Pythonによる統計グラフ
今回は matplotlib と pandas の連携による基本的なグラフ描...
~
***データの準備
統計グラフの作成には、対象となるデータを''データフレーム'...
df = pd.read_csv( '/path/to/xxxxx.csv' )
~
***ヒストグラム
#image(Pandas/hist.png,right,30%)
ヒストグラム(柱状グラフ、度数分布図)は、横軸に階級、縦...
データフレームからヒストグラムを生成するコードは非常に簡...
df.hist( ) 全項目一挙表示
df[ 'XXX' ] .hist( ) 特定カラムの表示
&small(df はデータフレーム変数の例です。);
~
***ボックスプロット
#image(Pandas/box.png,right,30%)
ボックスプロット(箱ひげ図)は、データのばらつきを可視化...
一般に以下の五数が要約(five-number summary)されて表示さ...
-最小値(minimum)
-第1四分位点(lower quartile)
-中央値(第2四分位点、median)
-第3四分位点(upper quartile)
-最大値(maximum)
以下のコードは、対象カラム(XXX)をグループ(AAA)別に表...
df.boxplot( column='XXX' , by='AAA' )
~
***散布図
#image(Pandas/scatter.png,right,30%)
散布図(scatter plot)は、縦軸、横軸に2つの量的データ項...
以下のコードは、x軸とy軸にカラム項目を指定して表示します。
df.plot.scatter( x='XXX', y='YYY' )
~
***折れ線グラフ・棒グラフ・円グラフ
これらのグラフは項目間の推移や比較を見るために使います。...
# 性別ごとに国語・英語・数学の平均値を算出
df_mean = df.groupby( 'Gender' , as_index=False ).mean( )
df_mean
||Gender|Japanese|English|Mathematics|h
|0|F|62.350000|58.475000|39.800000|
|1|M|56.420455|41.142045|39.539773|
#image(Pandas/bar.png,right,30%)
生成された df_mean を使うと、簡単に積み重ね棒グラフができ...
df_mean.plot.bar( stacked=True )
&small(stacked=True は、積み重ねを有効にする・・という意...
~
~
**Pythonによる統計グラフの描画体験
CSVデータから統計量を視覚化するサンプルです。matplotlib ...
~
***ノートブックの新規作成
-__[[Google Colaboratory>https://colab.research.google.co...
-Untitled0.ipynb というファイル名を変更 > StatisticalGra...
~
***サンプルデータ
第9回と同じ Tips のデータをサンプルとして利用します。
直接読み込むので、ダウンロードの必要はありません。
https://github.com/mwaskom/seaborn-data/blob/master/tips....
//https://raw.githubusercontent.com/mwaskom/seaborn-data/...
~
***サンプルコード
JupyterNotebook形式(.ipynb)でプログラムを提供します。
https://github.com/koichi-inoue/DataScience/blob/main/Sta...
~
~
~
**プログラムの解説
***ライブラリーの読み込み
冒頭で、グラフ描画用のライブラリー''matplotlib''とデータ...
# matplotlib パッケージ から pyplot モジュールを plt と...
import matplotlib.pyplot as plt
# pandasライブラリの読み込み
import pandas as pd
~
***ヒストグラム・ボックスプロット・散布図
-ヒストグラム(度数分布) hist
以下の1行で、データフレームに含まれる「量的データ」すべ...
df.hist()
以下の一行で、グラフを表示します。この1行は書かなくても...
plt.show()
-ボックスプロット(箱ひげ図) boxplot
以下の一行で曜日ごとのチップの額に関するボックスプロット...
df.boxplot( column = 'tip', by = 'day' , figsize = ( 9, ...
figsize はノート上に表示されるグラフの幅と高さを指定して...
-散布図 plot.scatter
以下の一行で「総支払い額」と「チップ」の散布図が表示され...
df.plot.scatter( x = 'total_bill' , y = 'tip' , figsize ...
alpha は点をプロットする際の「不透明度」を意味します。
~
***棒グラフ・折れ線グラフ・円グラフ
-事前のデータ処理
折れ線グラフ、棒グラフ、円グラフでは、全てのデータを可視...
df2 = df.groupby( 'day' ).mean()
df2
-indexの並べ替え
データフレームを処理すると、項目がアルファベット順に出力...
df3 = df2.reindex( index = [ 'Thur', 'Fri', 'Sat' , 'Sun...
df3
-折れ線グラフ plot
以下の一行で量的データ項目の折れ線グラフが表示されます。...
df3.plot( figsize = ( 9, 6 ) )
-棒グラフ plot.bar
以下の一行で量的データ項目の棒グラフが表示されます。
df3.plot.bar( figsize = ( 9 , 6 ) )
-積み重ね棒グラフ
以下の一行で総支払額とチップの積み重ね棒グラフが表示され...
df3[ ['total_bill' , 'tip'] ].plot.bar( stacked=True , f...
-円グラフ plot.pie
以下の一行で量的データ項目の曜日構成比が円グラフとして表...
df3.plot.pie( subplots = True , figsize = (12,6) )
~
~
**学科サイトにリンク掲載(その5)
ノートを、学科サイトの個人ページからリンクして下さい。以...
-1. 自分のノートを開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[StatisticalGraphics1>https://colab.research.go・・=sh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
**APPENDIX
***数理グラフ
数式等を用いたグラフ表示のサンプルです。時間に余裕のある...
https://github.com/koichi-inoue/DataScience/blob/main/Plo...
~
~
ページ名: