https://amueller.github.io/word_cloud/
Word Cloudは、テキストデータにおけるワードの出現頻度を可視化するための Python ライブラリーです。
英語の場合は、単語間にスペースがあるので、解析が簡単ですが、日本語の場合はオリジナルの文章から単語間がスペースで区切られた「分かち書き」の状態に変換する作業が必要になります。
参考
テキストマイニングの結果が即欲しい場合は、以下のサイトで実現可能です。
Python 言語のライブラリとしてのインストールになるので、一般の Python3 の環境であれば、Terminalから以下のコマンドでインストールできます。
$ pip3 install wordcloud
import する際は、以下のように記述するのが一般的です。
from wordcloud import WordCloud
Google Colaboratory では Jupyter Notebook で利用できるライブラリーが「すべてインストール済み」という前提なので、ローカル環境での作業のように、必要なライブラリのインストールを行う必要はなく、コードセルに import 文を書くだけで使うことができます。
WordCloud()メソッドで描画ベースを作成し、generate()メソッドにテキストデータを渡すだけで簡単に生成できます。
txt = """ 文章 """ wc= wordcloud.WordCloud( width = 1280, height = 760, colormap='viridis') wc.generate( txt ) plt.imshow( wc ) plt.show()
以下のような一般のテキストデータが利用できます。