#author("2023-10-10T17:25:48+09:00;2023-10-10T14:04:01+09:00","default:inoue.ko","inoue.ko") #author("2023-10-10T17:26:57+09:00;2023-10-10T14:04:01+09:00","default:inoue.ko","inoue.ko") *因子分析 Factor Analysis ~ 因子分析は、多変量解析の一種で、複数の変数の背後にある潜在的な共通要因を見いだす分析手法です。 例えば、国語、数学、理科、社会、英語の5教科の成績の背後に「文系力」と「理系力」という潜在的要因を発見する・・のようなものが因子分析です。心理学におけるパーソナリティ特性の研究など、心理尺度の研究手法として使用さます。 ~ **概要 ***因子分析で用いる用語 -''観測変数'' 実際にデータとして与えられる変数。例えば、学生ごとの国語、数学、理科、社会、英語の各点数(この場合、変数は5つ)。 -''共通因子'' 「文系力」、「理系力」のような背景にある潜在的因子 -''独自因子'' 観測変数それぞれが他とは無関係に持つ独立性の高い因子 -''因子負荷量'' 共通因子が及ぼす影響力を示した係数 ~ ***変数と因子の関係 観測変数 = 因子負荷量 × 共通因子 + 独自因子 ~ ***付記:因子分析と主成分分析の違い 因子分析と主成分分析は、似たようなことをやっているのですが、分析の目的が異なります。因子分析では「潜在要因である共通因子が各観測変数に与える影響」を調べることが目的となるのに対し、主成分分析は「観測変数をもとに主成分を合成して作り出す(次元を落とす)」ということに目的があります。 ~ ~ **分析手順 -''共通因子の数を決める'' 因子分析では、分析者が仮説にもとづいて(あるいは固有値の大きなもの順に上位から選ぶなどして)、あらかじめ共通因子の数を決めてかかります。 &small(この場合の「固有値」とは、変数の「分散の大きさ」を意味します。ばらつきが大きくなるものほど、それが与える影響が大きいということを意味します。); -''因子負荷量を計算する'' 因子負荷量とは、共通因子が観測変数に及ぼす影響の強さを意味します。主因子法や最尤法など複数の解法があります。 #image(VarimaxRotation.jpg,right,40%) -''軸を回転させて因子負荷量を計算する'' 共通因子の特徴をより明確にし、意味を解釈するために座標軸を回転させます。軸の回転には以下の2つがあります。 --バリマックス回転(直交回転):右図 因子間が無相関(直交)になるよう維持 --プロマックス回転(斜交回転) 因子間の相関を許容したもの -''因子得点を計算する'' 因子得点とは、各データにおける共通因子の値で、例えば、各学生の「文系力」と「理系力」の値の一覧として得られます。因子得点を見ると、各学生の特徴を把握することができます。 ~ ~ **事例 43人の学生の5教科の得点ダミーデータを使ったサンプルです。 https://github.com/koichi-inoue/DataScience/blob/main/FactorAnalysis.ipynb -利用しているデータは以下 https://github.com/koichi-inoue/DataScience/blob/main/seiseki.csv -ノートは、以下の順に記載されています。 --ライブラリのインストールと読み込み --43名分の5教科の得点(CSVデータ)をデータフレームへ読み込み --データの標準化 --念の為、事前に5教科の相関を確認 --因子分析(因子を3として、負荷量・共通性・独自性を提示) --43名分の因子特典を提示 ~ ~ **APPENDIX ***関連ページ -__[[Statistics/PCA]]__ 主成分分析 ~ ***参考サイト -https://www.nttcoms.com/service/research/dataanalysis/factor-analysis/ -https://www.intage.co.jp/glossary/050/ -https://korekara-marketing.com/statistics-factor_analysis/ -https://qiita.com/y_itoh/items/227cb33317ceb09199c2 -https://qiita.com/roki18d/items/b76b8d153111814d84d4 ~ ~