今回からは Python というプログラミング言語を使います。データサイエンスの世界では、スプレッドシートを用いた統計処理と並んで、Python言語による統計処理が主流となっており、インターネット検索でも、様々な手法を知ることができます。
Pythonはさまざまな分野のアプリケーションで使われているインタープリタ型のプログラミング言語です。クリーンで読みやすい文法、手続き型のコードによる自然な表現、直感的なオブジェクト指向、事実上すべてのタスクをこなせる広範な標準ライブラリとサードパーティのモジュール、アプリケーションに組み込んでスクリプトインタフェースとして利用することが可能・・など様々な利点があります。
開発環境を含めてオープンソースです。無償でダウンロード>インストールして利用することができます。
Python言語を使うには、パソコンに開発環境をインストールする方法もありますが、ここでは Python の学習環境として様々なテキストで紹介されている Google Colaboratory を使用します。
Google Colaboratory とは、Googleの仮想マシン上で動く Jupyter Notebook*1 をベースとした開発環境です。Googleアカウントがあれば、日常的に用いているブラウザから誰でも無料で利用できます。
PythonBasics.ipynb
では、はじめましょう
Jupyter Notebookには、コード(プログラム)を書くためのコードセルと、テキスト(ノート)を書くためのテキストセルの2つがあります。この2つのセルを使うことで、見出し・解説・プログラムを文字通り「ノート」のようにまとめることができます。
a = 5 * 3 a
15
b = a *2 b
30
Googleアカウントがあれば、誰でも無料で利用できますが・・
プログラムの基本は、以下の流れです。
データの入力 > 計算処理 > 結果の出力
以下のソースを「コード」として コピー&ペーストしてお試し下さい。
a = input( "a = " ) b = input( "b = " ) a = int( a ) b = int( b ) c= a*b print( "a x b = ", c )
プログラミングの世界では「データを入れる器」のことを変数と言います。
Python の予約語以外であれば、自由な変数名を使うことができます。
x = 256 a = "hello"
変数には、数値・文字列・リストなど、様々なタイプがあります。
> 詳細:Python/Syntax
Python では # 記号以降はコメントとして扱われます。プログラム上で文の機能を一時的に無効にする(コメントアウト)場合にも利用可能です。
a = 1 # comment
a = 1 # b = 2 # c = 3 d = 4
上記のプログラムのノートを、学科サイトの個人ページからリンクして下さい。以下、手順です。
このリンクを知っているインターネット上の全員が閲覧できます。
-[[Python Basics>https://colab.research.go・・=sharing]]
このようなファイルを作っておくと、今後ちょっとしたコードの動作確認を行うためのノートとして活用することができます。