第11回 総合演習
データサイエンス/2024?|受講生一覧|汎用シート
はじめに
- 今後の授業について・・講義が中心になります。
- 第12回 機械学習入門
- 第13回 様々な手法の紹介
- 第14回 データサイエンスとAI
演習11|総合演習
授業アンケートの結果( n = XX )を CSV形式で用意ました。
https://github.com/koichi-inoue/DataScience/blob/main/enquete2024.csv
これまでに学んだ知識を使ってそれぞれ独自の分析を行なってください。
最初の5項目はカテゴリデータ、それ以降は5段階の数値データです。
- 専攻名(カテゴリー情報1)
- 性別(カテゴリー情報2)
- 犬派 or 猫派(カテゴリー情報3)
- 山派 or 海派(カテゴリー情報4)
- 和食派 or 洋食派(カテゴリー情報5)
- 授業内容に関する教員の説明は伝わっていますか
- 1回(100分)あたりの授業の情報量(演習の分量)について
- アンケート調査や統計分析に関心はありますか
- データサイエンスは、自分の将来にとって必要だと思いますか
- データサイエンスのツールとしてPython言語は有意義だと思いますか
- 形式科学(数学・統計学等)に対する関心度を5段階で回答して下さい
- 人文科学(文学・歴史・地理等)に対する関心度を5段階で回答して下さい
- 社会科学(政治・経済・法・教育等)・・5段階で回答して下さい
- 自然科学(物理・化学・生物等)に対する関心度を5段階で回答して下さい
- 語学(英語・中国語等)に対する関心度を5段階で回答して下さい
- 情報科学(コンピュータ・情報処理等)・・5段階で回答して下さい
- 芸術・デザイン分野に対する関心度を5段階で回答して下さい
- 1日あたりの読書の時間を教えて下さい(雑誌・漫画・新聞等も含む)
- 1日あたりの音楽鑑賞の時間を教えて下さい
- 1日あたりの映像(動画)の視聴時間を教えて下さい
- 1日あたりのWebの閲覧時間を教えて下さい(音楽・映像の視聴を除く)
- 1日あたりのゲームのプレイ時間を教えて下さい
- 1日あたりの人との対話の時間を教えて下さい(授業時間を除く)
- 1日あたりの自然と触れ合う時間を教えて下さい(散歩など)
ノートブックの新規作成
データ|受講生アンケートの結果
Data:アンケート結果(.csv)
サンプルコード
- ノートの冒頭で日本語表示のためのライブラリをインストールして下さい。
# グラフの日本語表示のために japanize-matplotlib をインストール
!pip install japanize-matplotlib
# 日本語表示のためのライブラリ
import japanize_matplotlib
- 続けて、以下の標準的なライブラリを読み込んで下さい。
# ライブラリの読み込み
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from scipy import stats
- 続けて、今回のアンケート結果のデータを読み込んで下さい。
# enquete2024.csv の読み込み
df = pd.read_csv("https://raw.githubusercontent.com/koichi-inoue/DataScience/main/enquete2024csv")
# 先頭5件の表示確認
df.head()
以降のサンプルコードはありません。これまでのノートを参考に、アンケート結果のデータを使って、以下のような統計解析と可視化を行ってみてください。
- 回答者数のクロス集計(専攻 x 性別)
- 数値項目間の相関(行列)
- 特定項目のヒストグラム(専攻別の分布の比較など)
- 特定項目の平均値の差の検定(専攻別「関心度」の平均値の比較など)
学科サイトにリンク掲載
ノートを、学科サイトの個人ページからリンクして下さい。以下、手順です。
- 1. 自分のノートを開いた状態で、右上の「共有」をクリック