LogoMark.png

WordCloud の変更点


#author("2023-11-27T12:04:12+09:00;2021-12-06T12:53:38+09:00","default:inoue.ko","inoue.ko")
#author("2023-11-27T12:05:07+09:00;2023-11-27T12:04:29+09:00","default:inoue.ko","inoue.ko")
*WordCloud
https://amueller.github.io/word_cloud/
~

#image(wordcloud.jpg,right,40%)
Word Cloudは、テキストデータにおけるワードの出現頻度を可視化するための Python ライブラリーです。
#clear

英語の場合は、単語間にスペースがあるので、解析が簡単ですが、日本語の場合はオリジナルの文章から単語間がスペースで区切られた「分かち書き」の状態に変換する作業が必要になります。

''参考''
テキストマイニングは、以下のようなサービスでも簡単に実現可能です。
-https://textmining.userlocal.jp/

~
~

**はじめに

***WordCloud のインストールとインポート
Python 言語のライブラリとしてのインストールになるので、一般の Python3 の環境であれば、Terminalから以下のコマンドでインストールできます。
 $ pip3 install wordcloud

import する際は、以下のように記述するのが一般的です。
 from wordcloud import WordCloud

''Google Colaboratory では'' Jupyter Notebook で利用できるライブラリーが「すべてインストール済み」という前提なので、ローカル環境での作業のように、必要なライブラリのインストールを行う必要はなく、コードセルに import 文を書くだけで使うことができます。
~

***ワードクラウドの生成に用いるメソッド
WordCloud()メソッドで描画ベースを作成し、generate()メソッドにテキストデータを渡すだけで簡単に生成できます。

 txt = """ 文章 """
 wc= wordcloud.WordCloud( width = 1280, height = 760, colormap='viridis')
 wc.generate( txt )
 plt.imshow( wc )
 plt.show()
~
~

**サンプル
***サンプルコード
-JupyterNotebook形式(.ipynb)でプログラムを提供します。
https://github.com/koichi-inoue/JupyterNotebook/blob/master/WordCloud.ipynb

-カラーマップには以下のものが利用できます。
https://matplotlib.org/stable/tutorials/colors/colormaps.html
例:'viridis', 'plasma', 'inferno', 'magma', 'cividis'
~

***サンプルデータ
以下のような一般のテキストデータが利用できます。
-https://en.wikipedia.org/wiki/Python_(programming_language)
-https://www.aozora.gr.jp/cards/000148/files/776_14941.html
~
~
~