データサイエンス/03
をテンプレートにして作成
LECTURE
担当科目一覧
ソーシャルデザイン概論/2025
ソーシャルデザイン演習/2025
情報デザイン論/2025
情報デザイン演習IIA/2025
コンピュータ概論/2025
3DCG演習/2025
データサイエンス/2025
情報デザイン研究/2025
卒業研究/2025
KEYWORDS
WEB DESIGN
SOCIAL DESIGN
SQUARES
LINKS
九州産業大学
芸術学部
芸術研究科
九産大美術館
九産大図書館
年間スケジュール
動画ニュース他
交通情報
気象・環境情報
危機に備えて
K'sLife
Office365Mail
Tools
SEARCH
開始行:
*第3回 統計解析2
[[データサイエンス/2025]]|[[受講生一覧>https://design.ky...
~
~
**前回の補足
***基礎事項の確認
-スプレッドシートにおける数式の書き方
頭に = を付けて、その後に計算対象となるセル名を使った数式...
= A5 + B5 ・・当該セルに、A5 の値と B5 の値の和
A5、B5のセルの内容が変わると、自動的に計算結果も変わりま...
-スプレッドシートにおける関数の書き方
=関数名(引数1, 引数2, ・・)
この場合の引数1は、一般に計算対象となる「セル群」が入り...
-スプレッドシートにおける小数部分のまるめ(四捨五入)につ...
小数点以下の桁数は、関数を使って丸める方法と、表示のみ桁...
--関数を使って丸める場合は、以下のように書きます。
=ROUND( 数値または関数 , 小数点以下の桁数)
--表示のみ桁数を揃えたい場合は、以下の2つの方法がありま...
表示形式を揃えたいセル範囲を選択し、
1) [ホーム]タブ>[小数点以下の表示桁数を増やす] / [減...
2) [セルの書式設定]ダイアログボックス>[表示形式]タブ>
[数値] >「小数点以下の桁数」を設定
--ただし、最終的に紙の書類が必要になる事務業務(お金の計...
内部データ:3.33・・+3.33・・+3.33 = 9.99・・
表示データ:3 + 3 + 3 = 10
印刷書類で見ると「1円がどこかへ消えた?」となってしまいま...
~
***セルの相対指定と絶対指定
数式・関数を他のセルに複製した場合は、引数となるセルの位...
=sum(B2:B11) を右隣のセルに複製すると、
=sum(C2:C11) となります。
逆に、どこに複製しても参照セルが動かないようにするには、 ...
= B2 / $A$100 は、下のセルに複製すると
= B3 / $A$100 となります。
分子は相対的に移動しますが、分母となるデータは固定的な場...
~
***絶対指定の利用例|偏差値の計算
-以下のシートにサンプルがあります。データ部分のみコピーし...
__[[偏差値の計算サンプル>https://docs.google.com/spreadsh...
-データは、学生ID(通し番号)と 得点が並んでいるだけです。
-表の上部の適当なセルに、平均と標準偏差を求めて下さい。
-各レコード(各学生)の得点に右に「偏差値」が出るようにし...
-数式の入力は一箇所、あとはオートフィルで埋めます。
~
***解説
この種の計算とオートフィル(あるいは複製)では、単純に式...
-偏差値を求める計算式は以下。$ はセルの絶対指定を意味しま...
=( 得点のセル - $平均値のセル)/ $標準偏差のセル * 10 +...
-サンプルでは以下のように書いています。
=(B6-$B$3)/$C$3 * 10 + 50
-この例では縦方向にオートフィルするので、参照先の行位置が...
=(B6-B$3)/C$3 * 10 + 50
~
~
**相関
統計分析では、個々のカテゴリ項目の代表値や散布度の把握と...
~
#image(Statistics/Correlation/correlation.jpg,center, 75%)
~
***共分散
はじめに「共分散」の概念から説明します。共分散とは「国語...
#mathjax( s_{xy} = \frac{1}{n} \sum_{i=1}^{n}(x_{i}-\bar{...
-共分散の値が正:X が大きいときに Y も大きくなる傾向がある
-共分散の値が 0: X と Y には関係がない
-共分散の値が負:X が大きくなると Y が小さくなる傾向がある
~
***相関係数
2つの変数の間の関係を測る指標で、「数学の点数が高い人は物...
#mathjax( r = \frac{(xとyの共分散) }{ (xの標準偏差) \time...
-&mathjax(r); は -1.0 から +1.0 までのいずれかの値をとる
-&mathjax(| r |); が 1.0 に近いほど相関が強く、0に近いほ...
レポート等で相関の有無について語る場合、一般的な目安は以...
-| r | = 0.7~1.0 かなり強い相関がある
-| r | = 0.4~0.7 やや相関あり
-| r | = 0.2~0.4 弱い相関あり
-| r | = 0~0.2 ほとんど相関なし
//-詳細はこちら >__[[Statistics/Descriptive]]__
~
~
**相関関係と因果関係について
私たちが身の回りの観察から見出す物事の「関係」には、「身...
~
***データ解析が見出すのは「相関」
一般に、大量のデータにもとづく統計的な解析や機械学習から...
経験的に観察された共変動は、因果関係の必要条件だが十分条...
&small(Edward Tufte);
~
***誤謬に注意
統計処理によって何らかの関係が見出された場合も、それを結...
-擬似相関(第3の要因が共通原因となっている)
「チョコレートの摂取量」と「ノーベル賞の受賞者数」に正の...
経済的に豊かであることが両者の共通要因
「小学生の身長」と「論理的思考力」に正の相関
学年が上がることが両者の共通要因
-因果関係の逆転
交番の数が多い地域ほど、犯罪件数が多い
犯罪件数が多い地域だから交番が多く設置された
猫が顔を洗うと雨が降る
雨が降る前の湿度上昇が、センサーであるひげを拭う行為を誘発
~
~
**演習3|相関係数
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2025.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***相関係数の計算
項目間の相関係数を計算してみましょう。
-元データは、全国の集計行と都道府県の47行あります。
-一番上の「全国」の行を削除、あるいは色分けして、間違って...
-あなたの興味関心にもとづいて、いくつかの項目のペアを選ん...
-列を移動して、ペアとなる列が横並びになるようにして下さい。
-ペアの右に空の列を挿入して、その一番上の行に、相関係数を...
=CORREL(範囲1, 範囲2)
例 =CORREL(C4:C50,D4:D50)
-列のペアを複数(数は任意)つくって、いろいろ試してみて下...
-「◯◯の値が大きな県は、△△の値も大きい」といった知見が得ら...
付記:サンプルデータのように比較可能な項目が多い場合は、...
~
***演習サンプル
以下、実際に相関係数を計算したサンプルです。
__[[相関係数の計算(SpreadSheet)>https://docs.google.com...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[相関係数の計算事例>https://docs.google.com/spreadshee...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
***付記
-[[Googleスプレッドシートで相関係数を求めてグラフ化する方...
~
~
**APPENDIX
***散布図から見える「データの特徴」について
相関のある現象では、直感的に散布図の中心を通る直線を想定...
~
***前処理段階でのデータのコピーミスに注意して下さい
散布図上で、極端な「外れ値」がある場合は、データの前処理...
&color(red){スプレッドシートは非常に便利なツールですが、...
~
~
~
終了行:
*第3回 統計解析2
[[データサイエンス/2025]]|[[受講生一覧>https://design.ky...
~
~
**前回の補足
***基礎事項の確認
-スプレッドシートにおける数式の書き方
頭に = を付けて、その後に計算対象となるセル名を使った数式...
= A5 + B5 ・・当該セルに、A5 の値と B5 の値の和
A5、B5のセルの内容が変わると、自動的に計算結果も変わりま...
-スプレッドシートにおける関数の書き方
=関数名(引数1, 引数2, ・・)
この場合の引数1は、一般に計算対象となる「セル群」が入り...
-スプレッドシートにおける小数部分のまるめ(四捨五入)につ...
小数点以下の桁数は、関数を使って丸める方法と、表示のみ桁...
--関数を使って丸める場合は、以下のように書きます。
=ROUND( 数値または関数 , 小数点以下の桁数)
--表示のみ桁数を揃えたい場合は、以下の2つの方法がありま...
表示形式を揃えたいセル範囲を選択し、
1) [ホーム]タブ>[小数点以下の表示桁数を増やす] / [減...
2) [セルの書式設定]ダイアログボックス>[表示形式]タブ>
[数値] >「小数点以下の桁数」を設定
--ただし、最終的に紙の書類が必要になる事務業務(お金の計...
内部データ:3.33・・+3.33・・+3.33 = 9.99・・
表示データ:3 + 3 + 3 = 10
印刷書類で見ると「1円がどこかへ消えた?」となってしまいま...
~
***セルの相対指定と絶対指定
数式・関数を他のセルに複製した場合は、引数となるセルの位...
=sum(B2:B11) を右隣のセルに複製すると、
=sum(C2:C11) となります。
逆に、どこに複製しても参照セルが動かないようにするには、 ...
= B2 / $A$100 は、下のセルに複製すると
= B3 / $A$100 となります。
分子は相対的に移動しますが、分母となるデータは固定的な場...
~
***絶対指定の利用例|偏差値の計算
-以下のシートにサンプルがあります。データ部分のみコピーし...
__[[偏差値の計算サンプル>https://docs.google.com/spreadsh...
-データは、学生ID(通し番号)と 得点が並んでいるだけです。
-表の上部の適当なセルに、平均と標準偏差を求めて下さい。
-各レコード(各学生)の得点に右に「偏差値」が出るようにし...
-数式の入力は一箇所、あとはオートフィルで埋めます。
~
***解説
この種の計算とオートフィル(あるいは複製)では、単純に式...
-偏差値を求める計算式は以下。$ はセルの絶対指定を意味しま...
=( 得点のセル - $平均値のセル)/ $標準偏差のセル * 10 +...
-サンプルでは以下のように書いています。
=(B6-$B$3)/$C$3 * 10 + 50
-この例では縦方向にオートフィルするので、参照先の行位置が...
=(B6-B$3)/C$3 * 10 + 50
~
~
**相関
統計分析では、個々のカテゴリ項目の代表値や散布度の把握と...
~
#image(Statistics/Correlation/correlation.jpg,center, 75%)
~
***共分散
はじめに「共分散」の概念から説明します。共分散とは「国語...
#mathjax( s_{xy} = \frac{1}{n} \sum_{i=1}^{n}(x_{i}-\bar{...
-共分散の値が正:X が大きいときに Y も大きくなる傾向がある
-共分散の値が 0: X と Y には関係がない
-共分散の値が負:X が大きくなると Y が小さくなる傾向がある
~
***相関係数
2つの変数の間の関係を測る指標で、「数学の点数が高い人は物...
#mathjax( r = \frac{(xとyの共分散) }{ (xの標準偏差) \time...
-&mathjax(r); は -1.0 から +1.0 までのいずれかの値をとる
-&mathjax(| r |); が 1.0 に近いほど相関が強く、0に近いほ...
レポート等で相関の有無について語る場合、一般的な目安は以...
-| r | = 0.7~1.0 かなり強い相関がある
-| r | = 0.4~0.7 やや相関あり
-| r | = 0.2~0.4 弱い相関あり
-| r | = 0~0.2 ほとんど相関なし
//-詳細はこちら >__[[Statistics/Descriptive]]__
~
~
**相関関係と因果関係について
私たちが身の回りの観察から見出す物事の「関係」には、「身...
~
***データ解析が見出すのは「相関」
一般に、大量のデータにもとづく統計的な解析や機械学習から...
経験的に観察された共変動は、因果関係の必要条件だが十分条...
&small(Edward Tufte);
~
***誤謬に注意
統計処理によって何らかの関係が見出された場合も、それを結...
-擬似相関(第3の要因が共通原因となっている)
「チョコレートの摂取量」と「ノーベル賞の受賞者数」に正の...
経済的に豊かであることが両者の共通要因
「小学生の身長」と「論理的思考力」に正の相関
学年が上がることが両者の共通要因
-因果関係の逆転
交番の数が多い地域ほど、犯罪件数が多い
犯罪件数が多い地域だから交番が多く設置された
猫が顔を洗うと雨が降る
雨が降る前の湿度上昇が、センサーであるひげを拭う行為を誘発
~
~
**演習3|相関係数
***サンプルデータの準備
-[[教育用標準データセット|SSDSE>https://www.nstac.go.jp/...
--https://www.nstac.go.jp/sys/files/SSDSE-E-2025.xlsx
--データの解説:https://www.nstac.go.jp/sys/files/kaisets...
-GoogleDrive > マイドライブ > DataScience に、ダウンロー...
-アップしたファイルをダブルクリックすると、ファイルがGoog...
-''メニュー > ファイル > 「Googleスプレッドシートとして...
~
***相関係数の計算
項目間の相関係数を計算してみましょう。
-元データは、全国の集計行と都道府県の47行あります。
-一番上の「全国」の行を削除、あるいは色分けして、間違って...
-あなたの興味関心にもとづいて、いくつかの項目のペアを選ん...
-列を移動して、ペアとなる列が横並びになるようにして下さい。
-ペアの右に空の列を挿入して、その一番上の行に、相関係数を...
=CORREL(範囲1, 範囲2)
例 =CORREL(C4:C50,D4:D50)
-列のペアを複数(数は任意)つくって、いろいろ試してみて下...
-「◯◯の値が大きな県は、△△の値も大きい」といった知見が得ら...
付記:サンプルデータのように比較可能な項目が多い場合は、...
~
***演習サンプル
以下、実際に相関係数を計算したサンプルです。
__[[相関係数の計算(SpreadSheet)>https://docs.google.com...
~
***学科サイトで学科サイトにリンク掲載
-1. Spreadsheet を開いた状態で、右上の「共有」をクリック
-2. 共有設定を変更して、以下のように表示される状態にしま...
このリンクを知っているインターネット上の全員が閲覧できま...
-3. 「リンクをコピー」をクリックして、そのアドレスを、以...
-[[相関係数の計算事例>https://docs.google.com/spreadshee...
-4. 以下のようになればOKです。
https://design.kyusan-u.ac.jp/socialdesign/?JohnSmith/Dat...
~
***付記
-[[Googleスプレッドシートで相関係数を求めてグラフ化する方...
~
~
**APPENDIX
***散布図から見える「データの特徴」について
相関のある現象では、直感的に散布図の中心を通る直線を想定...
~
***前処理段階でのデータのコピーミスに注意して下さい
散布図上で、極端な「外れ値」がある場合は、データの前処理...
&color(red){スプレッドシートは非常に便利なツールですが、...
~
~
~
ページ名: