データサイエンス/02
をテンプレートにして作成
LECTURE
担当科目一覧
コンピュータ概論/2024
データサイエンス/2024
3DCG演習/2024
情報デザイン研究/2024
卒業研究/2024
KEYWORDS
WEB DESIGN
SOCIAL DESIGN
SQUARES
LINKS
九州産業大学
芸術学部
芸術研究科
九産大美術館
九産大図書館
年間スケジュール
動画ニュース他
交通情報
気象・環境情報
危機に備えて
K'sLife
Office365Mail
Tools
SEARCH
開始行:
*第2回 統計分析1
[[データサイエンス/2024]]|[[受講生一覧>https://design.ky...
~
~
//***CONTENTS
//#contents2_1
//~
//~
**はじめに
-__[[CLノートの入力について>https://design.kyusan-u.ac.jp...
~
~
**基礎的用語の確認
***記述統計と推測統計
統計には、大きく以下の2つのタイプがあります。
-記述統計:得られたデータのみに注目し、その性質を知る
例:3年A組と3年B組の成績を比較する > 全数調査
-推測統計:標本(サンプル)から、発生元となる母集団の性質...
例:高血圧の人を対象に新薬の効果を検証する > 標本調査
一般に、集団の性質を知るために全てのデータを取ることは不...
~
***母集団と標本
関心の対象となる集団の全体を母集団、母集団から(無作為に...
-母集団(Population)
関心の対象となる集団全体のことを「母集団」といい、さらに...
-標本(Sample)
母集団の状態を推測するために「抽出」された一部の集団のこ...
~
***変数
統計学では、共通の測定手法で得られた同じ性質をもつデータ...
-データが身長だけの場合を「1変数のデータ」、身長と体重の...
-変数の数を ''次元'' と呼ぶこともあります。例えば、英語の...
変数は、''量的変数''と''質的変数''の大きく2つに分類され...
~
***量的変数 ( 定量的データ, 離散データ / 連続データ)
-''比率尺度''(ratio scale)同一性・順序性・加法性・等比性
原点(0)が定まっていて、間隔にも比率にも意味があるもの...
''例)''身長、体重、金額、絶対温度など
-''間隔尺度''(interval scale)同一性・順序性・加法性
測定対象の差を等間隔の目盛りで評価するもので、その和や差...
''例)''知能指数、摂氏の温度、満足度(非常によい:4,よい...
~
***質的変数(定性的データ, カテゴリーデータ )
-''順序尺度''(ordinal scale)同一性・順序性
順序には意味があるが、その間隔には意味がない数値を割り当...
''例)''ミネラルウォーターの売上BEST10(商品を順に1位、...
-''名義尺度''(nominal scale)同一性
対象を分類するために番号を割り当てたもので、等しいか否か...
''例)''血液型(A型:1,B型:2,・・・,O型:4)
~
***独立変数と従属変数
統計分析では、「何か」の操作が「別の何か」に影響するか(...
-''独立変数'' 実験者が操作する変数(原因)。
-''従属変数'' 測定される変数(結果)。
例えば、「鉛筆の軸の太さの違いで、文字の書きやすさが変わ...
重要なことは、「ああすればこうなる」という原因と結果の関...
~
~
**要約統計量(記述統計量)
集約したデータの性質を要約するための統計量を「要約統計量...
~
***代表値(measure of central tendency)
データの分布の特徴を表す値
-''平均''(mean):データの総和をデータ数で割った値。最も...
#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
-中央値(median):データを大きさの順に並べたときに中央に...
-最頻値(mode):度数分布において最も高い度数を示す値。
~
***散布度 (dispersion)
データの散らばりぐあいを表す値
-分散(population variance):偏差平方和をデータ数で割っ...
#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
-''標準偏差''(standard deviation):分散のルートをとった...
-四分位点:データを昇順に並べたときに、25%, 75% の位置に...
~
***参考
-__[[Statistics/Descriptive]]__
~
~
**データの分布について
***分布と代表値の選び方について
成績・身長・体重・血圧など、統計で用いる分布モデルといえ...
-参考:__[[Distribution]]__
-参考:__[[Google:べき分布 事例]]__
~
***偏差値について
平均 μ、標準偏差を σ とすると、データ &mathjax(x);の 偏差...
#mathjax(\frac{( x - μ ) }{σ} \times 10 + 50)
-平均 μ の位置が偏差値 50 です。
-平均 μ より σ だけ右の位置が偏差値 60になります。
~
~
**演習2|平均・分散・標準偏差
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2024.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***要約統計量(記述統計量)の計算
平均や分散等の基本統計量を計算してみましょう。
-元データには、全国の集計行と都道府県の47行ありますが、一...
-列が多く(横に長く)作業しづらい場合は、興味のある列のみ...
-要約統計量の計算は、表の下の方(沖縄の行よりも下)で行な...
-補足
--行・列の固定(ウインドウの分割)
--データの整列(ソーティング、昇順・降順)
~
***スプレッドシートにおける統計関数
-平均|Average
=AVERAGE( 範囲 )
-中央値|Median
=MEDIAN( 範囲 )
-分散|Variance
=VARP( 範囲 )
-標準偏差|Standard Deviation
=STDEVP( 範囲 )
-参考:分散を計算する関数には、''VARP'' と ''VARS'' の区...
~
***演習サンプル
以下、実際に要約統計量を計算したサンプルです。
__[[要約統計量の計算(SpreadSheet)>https://docs.google.c...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[要約統計量の計算事例>https://docs.google.com/spreadsh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
***付記
-SSDSE-Eの表にある「総計」と、実際の合計が合わない件
> 総計部分と47都道府県のデータは、元資料が異なるようです
-''計算式の範囲を間違えないよう注意してください。''
--計算対象となる範囲は47都道府県=47行になっている必要が...
--標準偏差の値は、分散の値のルートになっているはずです
--参考:Google検索で計算をチェックする方法 > 検索フォー...
2乗:xxxxx^2
ルート:sqrt(xxxxxxxx)
-コンピュータ(AIも含めて)は、自動的に計算結果を出してく...
--意味が理解できていないと、結果の間違いに気づきません。
--便利な道具には大きなリスクを伴うことを常に意識する必要...
~
~
**補足演習|セルの相対指定と絶対指定
平均と標準偏差がわかると、各データの「偏差値」を知ること...
~
***セルの相対指定:表記例 A2
複製時に参照セルの相対的な位置関係が保たれます
-例えば C2 のセルに「自身の左隣:B2」を参照する数式がある...
= B2 * 100
-C2のセル(の関数)を C3, D4 にコピーすると、以下のように...
C3のセル = B3 * 100
D4のセル = C4 * 100
~
***セルの絶対指定:表記例 $A$2, B$5, $C5
複製時に参照セルの位置が固定されます
-例えば C2のセルに「自身の左隣:B2」を絶対参照する数式が...
= $B$2 * 100
-この場合、数式を C3, D4 にコピーしても、数式は変化しませ...
C3のセル = $B$2 * 100
D4のセル = $B$2 * 100
~
***利用例|偏差値の計算
-以下のシートにサンプルがあります。データ部分のみコピーし...
__[[偏差値の計算サンプル>https://docs.google.com/spreadsh...
-データは、学生ID(通し番号)と 得点が並んでいるだけです。
-表の上部の適当なセルに、平均と標準偏差を求めて下さい。
-各レコード(各学生)の得点に右に「偏差値」が出るようにし...
-数式の入力は一箇所、あとはオートフィルで埋めます。
~
***解説
この種の計算とオートフィル(あるいは複製)では、単純に式...
-偏差値を求める計算式は以下。$ はセルの絶対指定を意味しま...
=( 得点のセル - $平均値のセル)/ $標準偏差のセル * 10 +...
-サンプルでは以下のように書いています。
=(B6-$B$3)/$C$3 * 10 + 50
-この例では縦方向にオートフィルするので、参照先の行位置が...
=(B6-B$3)/C$3 * 10 + 50
~
~
~
~
~
終了行:
*第2回 統計分析1
[[データサイエンス/2024]]|[[受講生一覧>https://design.ky...
~
~
//***CONTENTS
//#contents2_1
//~
//~
**はじめに
-__[[CLノートの入力について>https://design.kyusan-u.ac.jp...
~
~
**基礎的用語の確認
***記述統計と推測統計
統計には、大きく以下の2つのタイプがあります。
-記述統計:得られたデータのみに注目し、その性質を知る
例:3年A組と3年B組の成績を比較する > 全数調査
-推測統計:標本(サンプル)から、発生元となる母集団の性質...
例:高血圧の人を対象に新薬の効果を検証する > 標本調査
一般に、集団の性質を知るために全てのデータを取ることは不...
~
***母集団と標本
関心の対象となる集団の全体を母集団、母集団から(無作為に...
-母集団(Population)
関心の対象となる集団全体のことを「母集団」といい、さらに...
-標本(Sample)
母集団の状態を推測するために「抽出」された一部の集団のこ...
~
***変数
統計学では、共通の測定手法で得られた同じ性質をもつデータ...
-データが身長だけの場合を「1変数のデータ」、身長と体重の...
-変数の数を ''次元'' と呼ぶこともあります。例えば、英語の...
変数は、''量的変数''と''質的変数''の大きく2つに分類され...
~
***量的変数 ( 定量的データ, 離散データ / 連続データ)
-''比率尺度''(ratio scale)同一性・順序性・加法性・等比性
原点(0)が定まっていて、間隔にも比率にも意味があるもの...
''例)''身長、体重、金額、絶対温度など
-''間隔尺度''(interval scale)同一性・順序性・加法性
測定対象の差を等間隔の目盛りで評価するもので、その和や差...
''例)''知能指数、摂氏の温度、満足度(非常によい:4,よい...
~
***質的変数(定性的データ, カテゴリーデータ )
-''順序尺度''(ordinal scale)同一性・順序性
順序には意味があるが、その間隔には意味がない数値を割り当...
''例)''ミネラルウォーターの売上BEST10(商品を順に1位、...
-''名義尺度''(nominal scale)同一性
対象を分類するために番号を割り当てたもので、等しいか否か...
''例)''血液型(A型:1,B型:2,・・・,O型:4)
~
***独立変数と従属変数
統計分析では、「何か」の操作が「別の何か」に影響するか(...
-''独立変数'' 実験者が操作する変数(原因)。
-''従属変数'' 測定される変数(結果)。
例えば、「鉛筆の軸の太さの違いで、文字の書きやすさが変わ...
重要なことは、「ああすればこうなる」という原因と結果の関...
~
~
**要約統計量(記述統計量)
集約したデータの性質を要約するための統計量を「要約統計量...
~
***代表値(measure of central tendency)
データの分布の特徴を表す値
-''平均''(mean):データの総和をデータ数で割った値。最も...
#mathjax( \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i)
-中央値(median):データを大きさの順に並べたときに中央に...
-最頻値(mode):度数分布において最も高い度数を示す値。
~
***散布度 (dispersion)
データの散らばりぐあいを表す値
-分散(population variance):偏差平方和をデータ数で割っ...
#mathjax( s^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 )
-''標準偏差''(standard deviation):分散のルートをとった...
-四分位点:データを昇順に並べたときに、25%, 75% の位置に...
~
***参考
-__[[Statistics/Descriptive]]__
~
~
**データの分布について
***分布と代表値の選び方について
成績・身長・体重・血圧など、統計で用いる分布モデルといえ...
-参考:__[[Distribution]]__
-参考:__[[Google:べき分布 事例]]__
~
***偏差値について
平均 μ、標準偏差を σ とすると、データ &mathjax(x);の 偏差...
#mathjax(\frac{( x - μ ) }{σ} \times 10 + 50)
-平均 μ の位置が偏差値 50 です。
-平均 μ より σ だけ右の位置が偏差値 60になります。
~
~
**演習2|平均・分散・標準偏差
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2024.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***要約統計量(記述統計量)の計算
平均や分散等の基本統計量を計算してみましょう。
-元データには、全国の集計行と都道府県の47行ありますが、一...
-列が多く(横に長く)作業しづらい場合は、興味のある列のみ...
-要約統計量の計算は、表の下の方(沖縄の行よりも下)で行な...
-補足
--行・列の固定(ウインドウの分割)
--データの整列(ソーティング、昇順・降順)
~
***スプレッドシートにおける統計関数
-平均|Average
=AVERAGE( 範囲 )
-中央値|Median
=MEDIAN( 範囲 )
-分散|Variance
=VARP( 範囲 )
-標準偏差|Standard Deviation
=STDEVP( 範囲 )
-参考:分散を計算する関数には、''VARP'' と ''VARS'' の区...
~
***演習サンプル
以下、実際に要約統計量を計算したサンプルです。
__[[要約統計量の計算(SpreadSheet)>https://docs.google.c...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[要約統計量の計算事例>https://docs.google.com/spreadsh...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
***付記
-SSDSE-Eの表にある「総計」と、実際の合計が合わない件
> 総計部分と47都道府県のデータは、元資料が異なるようです
-''計算式の範囲を間違えないよう注意してください。''
--計算対象となる範囲は47都道府県=47行になっている必要が...
--標準偏差の値は、分散の値のルートになっているはずです
--参考:Google検索で計算をチェックする方法 > 検索フォー...
2乗:xxxxx^2
ルート:sqrt(xxxxxxxx)
-コンピュータ(AIも含めて)は、自動的に計算結果を出してく...
--意味が理解できていないと、結果の間違いに気づきません。
--便利な道具には大きなリスクを伴うことを常に意識する必要...
~
~
**補足演習|セルの相対指定と絶対指定
平均と標準偏差がわかると、各データの「偏差値」を知ること...
~
***セルの相対指定:表記例 A2
複製時に参照セルの相対的な位置関係が保たれます
-例えば C2 のセルに「自身の左隣:B2」を参照する数式がある...
= B2 * 100
-C2のセル(の関数)を C3, D4 にコピーすると、以下のように...
C3のセル = B3 * 100
D4のセル = C4 * 100
~
***セルの絶対指定:表記例 $A$2, B$5, $C5
複製時に参照セルの位置が固定されます
-例えば C2のセルに「自身の左隣:B2」を絶対参照する数式が...
= $B$2 * 100
-この場合、数式を C3, D4 にコピーしても、数式は変化しませ...
C3のセル = $B$2 * 100
D4のセル = $B$2 * 100
~
***利用例|偏差値の計算
-以下のシートにサンプルがあります。データ部分のみコピーし...
__[[偏差値の計算サンプル>https://docs.google.com/spreadsh...
-データは、学生ID(通し番号)と 得点が並んでいるだけです。
-表の上部の適当なセルに、平均と標準偏差を求めて下さい。
-各レコード(各学生)の得点に右に「偏差値」が出るようにし...
-数式の入力は一箇所、あとはオートフィルで埋めます。
~
***解説
この種の計算とオートフィル(あるいは複製)では、単純に式...
-偏差値を求める計算式は以下。$ はセルの絶対指定を意味しま...
=( 得点のセル - $平均値のセル)/ $標準偏差のセル * 10 +...
-サンプルでは以下のように書いています。
=(B6-$B$3)/$C$3 * 10 + 50
-この例では縦方向にオートフィルするので、参照先の行位置が...
=(B6-B$3)/C$3 * 10 + 50
~
~
~
~
~
ページ名: