データサイエンス/02
をテンプレートにして作成
LECTURE
担当科目一覧
ソーシャルデザイン概論/2024
ソーシャルデザイン演習/2024
情報デザイン論/2024
情報デザイン演習IIA/2024
3DCG演習/2024
情報デザイン研究/2024
卒業研究/2024
KEYWORDS
WEB DESIGN
SOCIAL DESIGN
SQUARES
LINKS
九州産業大学
芸術学部
芸術研究科
九産大美術館
九産大図書館
年間スケジュール
動画ニュース他
交通情報
気象・環境情報
危機に備えて
K'sLife
Office365Mail
Tools
SEARCH
開始行:
*第2回 統計分析1
[[データサイエンス/2023]]|[[受講生一覧>https://design.ky...
~
***CONTENTS
#contents2_1
~
~
**基礎的用語の確認
***記述統計と推測統計
統計には、大きく以下の2つのタイプがあります。
-記述統計:得られたデータのみに注目し、その性質を知る
例:3年A組と3年B組の成績を比較する > 全数調査
-推測統計:標本(サンプル)から、発生元となる母集団の性質...
例:高血圧の人を対象に新薬の効果を検証する > 標本調査
一般に、集団の性質を知るために全てのデータを取ることは不...
~
***母集団と標本
関心の対象となる集団の全体を母集団、母集団から(無作為に...
-母集団(Population)
関心の対象となる集団全体のことを「母集団」といい、さらに...
-標本(Sample)
母集団の状態を推測するために「抽出」された一部の集団のこ...
~
***変数
統計学では、共通の測定手法で得られた同じ性質をもつデータ...
-データが身長だけの場合を「1変数のデータ」、身長と体重の...
-変数の数を ''次元'' と呼ぶこともあります。例えば、英語の...
変数は、''量的変数''と''質的変数''の大きく2つに分類され...
~
***量的変数 ( 定量的データ, 離散データ / 連続データ)
-''比率尺度''(ratio scale)同一性・順序性・加法性・等比性
原点(0)が定まっていて、間隔にも比率にも意味があるもの...
''例)''身長、体重、金額、絶対温度など
-''間隔尺度''(interval scale)同一性・順序性・加法性
測定対象の差を等間隔の目盛りで評価するもので、その和や差...
''例)''知能指数、摂氏の温度、満足度(非常によい:4,よい...
~
***質的変数(定性的データ, カテゴリーデータ )
-''順序尺度''(ordinal scale)同一性・順序性
順序には意味があるが、その間隔には意味がない数値を割り当...
''例)''ミネラルウォーターの売上BEST10(商品を順に1位、...
-''名義尺度''(nominal scale)同一性
対象を分類するために番号を割り当てたもので、等しいか否か...
''例)''血液型(A型:1,B型:2,・・・,O型:4)
~
***独立変数と従属変数
統計分析では、「何か」の操作が「別の何か」に影響するか(...
-''独立変数'' 実験者が操作する変数(原因)。
-''従属変数'' 測定される変数(結果)。
例えば、「鉛筆の軸の太さの違いで、文字の書きやすさが変わ...
重要なことは、「ああすればこうなる」という原因と結果の関...
~
~
**要約統計量(記述統計量)
標本の性質を要約するための統計量を「要約統計量」といいま...
~
***代表値(measure of central tendency)
データの分布の特徴を表す値
-''平均''(mean):データの総和をデータ数で割った値。最も...
#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
-中央値(median):データを大きさの順に並べたときに中央に...
-最頻値(mode):度数分布において最も高い度数を示す値。
~
***散布度 (dispersion)
データの散らばりぐあいを表す値
-分散(population variance):偏差平方和をデータ数で割っ...
#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
-''標準偏差''(standard deviation):分散のルートをとった...
-四分位点:データを昇順に並べたときに、25%, 75% の位置に...
~
***参考
-__[[Statistics/Descriptive]]__
~
~
**データの分布について
***分布と代表値の選び方について
成績・身長・体重・血圧など、統計で用いる分布モデルといえ...
-参考:__[[Distribution]]__
-参考:__[[Google:べき分布 事例]]__
~
***偏差値について
平均 μ、標準偏差を σ とすると、データ &mathjax(x);の 偏差...
#mathjax(\frac{( x - μ ) }{σ} \times 10 + 50)
-平均 μ の位置が偏差値 50 です。
-平均 μ より σ だけ右の位置が偏差値 60になります。
~
~
**演習2|平均・分散・標準偏差
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2023.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***要約統計量(記述統計量)の計算
平均や分散等の基本統計量を計算してみましょう。
-元データは、全国の集計行と都道府県の47行あります。
-一番上の「全国」の行を削除、あるいは色分けして、間違って...
-列が多く(横に長く)作業しづらい場合は、適当に削除して構...
-計算式は、表の下の方(沖縄の行の下)に追加して下さい。
~
***演習サンプル
以下、実際に要約統計量を計算したサンプルです。
__[[要約統計量の計算(SpreadSheet)>https://docs.google.c...
~
***スプレッドシートにおける統計関数
-平均|Average
=AVERAGE( 範囲 )
-中央値|Median
=MEDIAN( 範囲 )
-分散|Variance
=VARP( 範囲 )
-標準偏差|Standard Deviation
=STDEVP( 範囲 )
-参考:分散を計算する関数には、''VARP'' と ''VARS'' の区...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[要約統計量の計算事例>https://docs.google.com/spreadsh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
~
~
終了行:
*第2回 統計分析1
[[データサイエンス/2023]]|[[受講生一覧>https://design.ky...
~
***CONTENTS
#contents2_1
~
~
**基礎的用語の確認
***記述統計と推測統計
統計には、大きく以下の2つのタイプがあります。
-記述統計:得られたデータのみに注目し、その性質を知る
例:3年A組と3年B組の成績を比較する > 全数調査
-推測統計:標本(サンプル)から、発生元となる母集団の性質...
例:高血圧の人を対象に新薬の効果を検証する > 標本調査
一般に、集団の性質を知るために全てのデータを取ることは不...
~
***母集団と標本
関心の対象となる集団の全体を母集団、母集団から(無作為に...
-母集団(Population)
関心の対象となる集団全体のことを「母集団」といい、さらに...
-標本(Sample)
母集団の状態を推測するために「抽出」された一部の集団のこ...
~
***変数
統計学では、共通の測定手法で得られた同じ性質をもつデータ...
-データが身長だけの場合を「1変数のデータ」、身長と体重の...
-変数の数を ''次元'' と呼ぶこともあります。例えば、英語の...
変数は、''量的変数''と''質的変数''の大きく2つに分類され...
~
***量的変数 ( 定量的データ, 離散データ / 連続データ)
-''比率尺度''(ratio scale)同一性・順序性・加法性・等比性
原点(0)が定まっていて、間隔にも比率にも意味があるもの...
''例)''身長、体重、金額、絶対温度など
-''間隔尺度''(interval scale)同一性・順序性・加法性
測定対象の差を等間隔の目盛りで評価するもので、その和や差...
''例)''知能指数、摂氏の温度、満足度(非常によい:4,よい...
~
***質的変数(定性的データ, カテゴリーデータ )
-''順序尺度''(ordinal scale)同一性・順序性
順序には意味があるが、その間隔には意味がない数値を割り当...
''例)''ミネラルウォーターの売上BEST10(商品を順に1位、...
-''名義尺度''(nominal scale)同一性
対象を分類するために番号を割り当てたもので、等しいか否か...
''例)''血液型(A型:1,B型:2,・・・,O型:4)
~
***独立変数と従属変数
統計分析では、「何か」の操作が「別の何か」に影響するか(...
-''独立変数'' 実験者が操作する変数(原因)。
-''従属変数'' 測定される変数(結果)。
例えば、「鉛筆の軸の太さの違いで、文字の書きやすさが変わ...
重要なことは、「ああすればこうなる」という原因と結果の関...
~
~
**要約統計量(記述統計量)
標本の性質を要約するための統計量を「要約統計量」といいま...
~
***代表値(measure of central tendency)
データの分布の特徴を表す値
-''平均''(mean):データの総和をデータ数で割った値。最も...
#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
-中央値(median):データを大きさの順に並べたときに中央に...
-最頻値(mode):度数分布において最も高い度数を示す値。
~
***散布度 (dispersion)
データの散らばりぐあいを表す値
-分散(population variance):偏差平方和をデータ数で割っ...
#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
-''標準偏差''(standard deviation):分散のルートをとった...
-四分位点:データを昇順に並べたときに、25%, 75% の位置に...
~
***参考
-__[[Statistics/Descriptive]]__
~
~
**データの分布について
***分布と代表値の選び方について
成績・身長・体重・血圧など、統計で用いる分布モデルといえ...
-参考:__[[Distribution]]__
-参考:__[[Google:べき分布 事例]]__
~
***偏差値について
平均 μ、標準偏差を σ とすると、データ &mathjax(x);の 偏差...
#mathjax(\frac{( x - μ ) }{σ} \times 10 + 50)
-平均 μ の位置が偏差値 50 です。
-平均 μ より σ だけ右の位置が偏差値 60になります。
~
~
**演習2|平均・分散・標準偏差
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2023.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***要約統計量(記述統計量)の計算
平均や分散等の基本統計量を計算してみましょう。
-元データは、全国の集計行と都道府県の47行あります。
-一番上の「全国」の行を削除、あるいは色分けして、間違って...
-列が多く(横に長く)作業しづらい場合は、適当に削除して構...
-計算式は、表の下の方(沖縄の行の下)に追加して下さい。
~
***演習サンプル
以下、実際に要約統計量を計算したサンプルです。
__[[要約統計量の計算(SpreadSheet)>https://docs.google.c...
~
***スプレッドシートにおける統計関数
-平均|Average
=AVERAGE( 範囲 )
-中央値|Median
=MEDIAN( 範囲 )
-分散|Variance
=VARP( 範囲 )
-標準偏差|Standard Deviation
=STDEVP( 範囲 )
-参考:分散を計算する関数には、''VARP'' と ''VARS'' の区...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[要約統計量の計算事例>https://docs.google.com/spreadsh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
~
~
~
ページ名: