LogoMark.png

データサイエンス/10 のバックアップ(No.2)


第9回 データビジュアライゼーション2

データサイエンス/2023?

CONTENTS




地理情報の可視化

統計データを、国や地域、道路など地図上に可視化する需要が高まっています。今回は、地図情報の活用と、地図上にデータをプロットする方法を体験します。

地理情報の可視化ライブラリ Folium

オープンソースのJavaScriptライブラリLeafletを用いて Pythonでインタラクティブな地図を生成するライブラリです。

緯度・経度の値を使ったマーカー表示や、ヒートマップの表示、また GeoJSON形式の地理情報と統計情報を合わせた各種の可視化が可能になります。

Foliumはデフォルトで OpenStreetMap を使用しています。


コロプレス図とは

コロプレス図とは、統計数値を地図上に表現したもので、区域単位(国別など)の情報を、統計値に応じた色彩や明暗によって表します。人口やGDP、生産高など、土地の上に分布するものを表現するのに適しています。

GeoJSONデータとは

緯度・経度情報を取得するには

演習9

地理情報のビジュアライゼーション

ノートブックの新規作成

サンプルデータ


サンプルコード

学科サイトにリンク掲載(演習7)

ノートを、学科サイトの個人ページからリンクして下さい。以下、手順です。

演習9|プログラムの解説

基本的な地図の描画(Folium)

地図上にマーカーを表示(Folium)

地図上にサークルを表示(Folium)

上と同様につき、省略します。

ヒートマップの描画(Folium)

GeoJSON データを活用したコロプレス図(Folium)

plotly.express による地球儀(plotly)




WordCloud

ワードクラウドとは

ワードクラウドは、文章の中に含まれる単語をカウントして、どのような単語が多く含まれるかを視覚的に表現します。

英語の場合は、単語間にスペースがあるので、解析が簡単ですが、日本語の場合はオリジナルの文章から単語間がスペースで区切られた「分かち書き」の状態に変換する作業が必要になります。

ライブラリ

演習9+

ノートブックの新規作成

サンプルデータ

以下のような一般のテキストデータが利用できます。

サンプルコード

JupyterNotebook形式(.ipynb)でプログラムを提供します。
https://github.com/koichi-inoue/DataScience/blob/main/WordCloud.ipynb

演習9+|プログラムの解説

(書きかけです)