- 追加された行はこの色です。
- 削除された行はこの色です。
#author("2020-07-08T20:07:17+09:00;2020-07-08T13:05:19+09:00","default:inoue.ko","inoue.ko")
*ロジスティック回帰
Logistic Regression
~
***概要(教師あり|分類)
ロジスティック回帰とは、線形回帰分析を分類問題に応用したアルゴリズムで、例えば、商品を購入するか否か、衝突するか否か、採用すべきか否かなどの2値分類を、0から1の範囲の確率を示す[[ロジスティック関数>GoogleImage:ロジスティック関数]]を用いて推測します。
ロジスティック関数:σSUB{a};(x) = 1 / ( 1 + eSUP{-ax}; )
2値分類(0:陰性 or 1:陽性)の場合、予測確率 0.5 をしきい値としてクラス分けを行います。確率0.2 であれば予測値は「 0」、確率が 0.85 であれば予測値は「1」と分類するわけです。ちなみに、確率がちょうど 0.5 となる境目の部分を「決定境界」といいます。
//学習では「ロジスティック損失」というものを誤差関数として、これが最小になるように学習させます。
~
***用語解説
~
***プログラム例
(準備中)
//以下に、3値分類の線形回帰のサンプルを掲載しています。
//ipynb(JupyterNotebook)形式で、GitHubに置いていますが、レンダリングがタイムアウトする場合は、下の nbviewer 経由でご覧下さい。
//-GitHub:[[LogisticRegression.ipynb>https://github.com/koichi-inoue/JupyterNotebook/blob/master/LogisticRegression.ipynb]]
//-nbviewer:[[LogisticRegression.ipynb>https://nbviewer.jupyter.org/github/koichi-inoue/JupyterNotebook/blob/master/LogisticRegression.ipynb]]
//-このプログラム例では、ガクの長さ(sepal length)、花弁の長さ(petal length) のみ使用して、3品種の分類を行なっています。
-使用したライブラリ
--pandas:データ解析
--matplotlib:グラフ描画
--sklearn:ロジスティック回帰
-使用したモデル
scikit-learn、linear_model の [[LogisticRegressionモデル>https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html]]を使用
--fitメソッド:ロジスティック回帰モデルの重みを学習
--predictメソッド:説明変数の値からクラスを予測
-使用したデータ:iris(sklearn)
~
~
~
~