すぐに使える Python の開発環境
Google Colaboratory とは、Googleの仮想マシン上で動くIPythonの実行環境で、Jupyter Notebook を利用します。Googleアカウントがあれば、ブラウザから誰でも無料で利用できます。特にAIを含むデータサイエンス系の開発では、クラウド上のGPU環境が使える点で、ローカル環境よりも優れています。登場以来、非常に注目を集めている存在です。
https://colab.research.google.com
また、Jupyter Notebook は、ブラウザ上で Python のコードの編集とインタラクティブな実行ができるだけでなく、テキストドキュメントを挿入したノートとして情報共有する仕組みを実現したオープンソースのWebアプリケーションです。数値シミュレーション、統計モデリング、データの視覚化、機械学習などを得意とする、総合的なデータサイエンスツールです。
Jupyter Notebookには、コード(プログラム)を書くためのコードセルと、テキスト(ノート)を書くためのテキストセルの2つがあります。この2つのセルを使うことで、見出し・解説・プログラムを文字通り「ノート」のようにまとめることができます。
Googleアカウントがあれば、誰でも無料で利用できますが・・
a = 5 * 3 a
15
b = a *2 b
30
Google Colaboratory では Jupyter Notebook で利用できるライブラリーが「すべてインストール済み」という前提なので、ローカル環境での作業のように、必要なライブラリのインストールを行う必要はなく、コードセルに import 文を書くだけで使うことができます。
import io import requests import PIL response = requests.get(" https://・・画像データのURL ") PIL.Image.open(io.BytesIO(response.content))
import matplotlib.pyplot as plt x_values = ['Sun', 'Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat'] y_values = [50, 100, 120, 80, 180, 130, 70] plt.bar(x_values, y_values) plt.plot() plt.show()
import warnings warnings.resetwarnings() warnings.simplefilter('ignore', FutureWarning) warnings.simplefilter('ignore', RuntimeWarning)
shell とはファイル操作やプログラムを実行させるコマンドを入力するシステムです。デフォルトで用意されていないライブラリー等を利用する場合は、shellコマンドを使ってインストールすることができます。
shell コマンドを実行したい場合は、コードセルの中で以下のようにコマンドの頭に [ ! ] を付けて記載します。Linux のコマンドも使えます。
!cat /etc/issue
!python --version Python 3.6.9
!pip install --upgrade numpy
!pip freeze absl-py==0.10.0 alabaster==0.7.12 albumentations==0.1.12 altair==4.1.0 argon2-cffi==20.1.0 :
!pip install japanize-matplotlib import matplotlib.pyplot as plt import japanize_matplotlib
マジックコマンドは iPython の独自機能で、コマンドの頭に [ % ] を付けて記載します。以下のようにディレクトリの操作をする場合などに用いられます。
%mkdir test %ls sample_data/ test/
google.colab ライブラリの利用で Google Drive と連携できます。
from google.colab import drive
以下の記述で GoogleColab の /content/drive にMy Drive がマウントされます
from google.colab import drive drive.mount('/content/drive')
・・・Enter your authorization code:
!ls '/content/drive/My Drive'
import pandas as pd df = pd.read_csv("/content/drive/My Drive/path/to/sample.csv") df = pd.read_excel("/content/drive/My Drive/path/to/sample.xlsx")などとしてデータフレームに読み込むことが可能です。
google.colab ライブラリの利用で、ファイルのアップダウンが可能です。
from google.colab import files
以下の記述で実行すると [ファイル選択] ダイアログが開いて Google Colab上にデータをアップロードすることができます。
# GoogleColab のファイル操作機能の読み込み from google.colab import files # ファイルのアップロード uploaded = files.upload() [ファイル選択] sample.jpg sample.jpg(image/jpeg) - 92287 bytes, last modified: 2020/8/21 - 100% done Saving sample.jpg to sample.jpg
以下、アップロードの実行例
以下の記述で Google Colab上のデータをダウンロードできます。
# GoogleColab のファイル操作機能の読み込み from google.colab import files : # プロットされた画像を保存 plt.savefig('sample.png') # ファイルのダウンロード files.download('sample.jpg')
以下、Google Colab とローカルでファイルの行き来が可能です。
ファイル >ノートブックをアップロード ファイル >.ipynb をダウンロード
GitHub のアカウントに連動して GitHubでノートブックの公開が可能です。
ファイル > GitHub にコピーを保存