scikit-learn
をテンプレートにして作成
LECTURE
担当科目一覧
コンピュータ概論/2024
データサイエンス/2024
3DCG演習/2024
情報デザイン研究/2024
卒業研究/2024
KEYWORDS
WEB DESIGN
SOCIAL DESIGN
SQUARES
LINKS
九州産業大学
芸術学部
芸術研究科
九産大美術館
九産大図書館
年間スケジュール
動画ニュース他
交通情報
気象・環境情報
危機に備えて
K'sLife
Office365Mail
Tools
SEARCH
開始行:
*scikit-learn
https://scikit-learn.org/
~
**概要
***Scikit-learnとは
#image(https://scikit-learn.org/stable/_static/ml_map.png...
scikit-learn (サイキット・ラーン)は Python用のオープン...
分類(クラス分類)向きのものと、回帰(予測)向きのもの、...
#clear
&scale(80){図版:https://scikit-learn.org/stable/tutorial...
~
***Scikit-learn のインストール
[[Python]] 言語のライブラリとしてのインストールになるので...
$ pip3 install scikit_learn
$ pip3 list ← 念のため一覧表示
~
***Scikit-learnを使った分類プログラムの流れ
データ読み込み > 訓練データとテストデータに分割 > 学習...
-1. ライブラリとデータセットの読み込み
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn import metrics
digits = datasets.load_digits()
-2. 訓練データとテストデータの用意
X = digits.data
y = digits.target
X_train, X_test, y_train, y_test = train_test_split( X, ...
&small(一般に、train は訓練データ、test は評価用のテスト...
&small(関数モデルを y = f(X) と書いた場合の、X が説明変数...
&small(一般に ベクトルである X は大文字、値である y は小...
-3. アルゴリズムの指定と学習
clf = svm.SVC( gamma=0.001 )
clf.fit( X_train, y_train )
&small(clf は一般に classifier(分類器)の略です。);
-4. モデルの評価
accuracy = clf.score( X_test, y_test )
print( "正解率 {accuracy} ")
predicted = clf.predict( X_test )
print( metrics.classification_report( y_test, predicted ...
&small(predict は「予測」の意味です);
~
~
**代表的な機械学習の手法
***教師あり学習
-''分類''|Classification
--[[LogisticRegression]]
--LinearSVM
--[[DecisionTree]]
--[[RandomForest]]
--[[SupportVectorMachine]](SVM)
--GradientTreeBoosting
--NaiveBayes
--[[NeuralNetwork]](Supervised)
-''回帰''|Regression
--[[LinearRegression]]
--RidgeRegression
--Lasso
// &small(入力に無視して良い変数が混じっている)
--SVR
--BaggingRegressor
--GradientBoostingREgressor
~
***教師なし学習
-''クラスタリング''|Clustering
--[[k-means]]
--MeanShift
//--VBGMM
--GaussianMixtureModels(GMM)
--SpectralClustering
-''異常値検知''|Novelty and Outlier Detection
--Isolation Forest
--Local OutlierFactor
--One-Class SVM
-''次元削減(圧縮)''|Dimension Reduction
--[[PrincipalComponentAnalysis>Statistics/PCA]](PCA)
--SpectralEmbedding
// その他
//-SGD (Stochastic Gradient Descent)
//-最近傍・k近傍法 (Nearest Neighbors)
//-ガウス過程(Gaussian Processes)
//-十字型分解(Cross decomposition)
//-アンサンブル学習(Ensemble methods)
//-マルチクラス・マルチラベルアルゴリズム(Multiclass and ...
//-特徴量選択(Feature selection)
//-半教師あり学習(Semi-Supervised)
//-アイソトニック回帰(Isotonic regression)
//-キャリブレーション(Probability calibration)
//--Neural network models (Unsupervised) )
//--Biclustering
//--共分散推定(Covariance estimation)
//--密度推定(Density Estimation)
//--Isomap
//-t-SNE
~
~
**データセット
-一般データセットAPI (General dataset API)
-トイデータセット (Toy datasets)
-リアルワールドデータセット (Real world datasets)
-生成データセット (Generated datasets)
-その他 (Loading other datasets)
~
~
終了行:
*scikit-learn
https://scikit-learn.org/
~
**概要
***Scikit-learnとは
#image(https://scikit-learn.org/stable/_static/ml_map.png...
scikit-learn (サイキット・ラーン)は Python用のオープン...
分類(クラス分類)向きのものと、回帰(予測)向きのもの、...
#clear
&scale(80){図版:https://scikit-learn.org/stable/tutorial...
~
***Scikit-learn のインストール
[[Python]] 言語のライブラリとしてのインストールになるので...
$ pip3 install scikit_learn
$ pip3 list ← 念のため一覧表示
~
***Scikit-learnを使った分類プログラムの流れ
データ読み込み > 訓練データとテストデータに分割 > 学習...
-1. ライブラリとデータセットの読み込み
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn import metrics
digits = datasets.load_digits()
-2. 訓練データとテストデータの用意
X = digits.data
y = digits.target
X_train, X_test, y_train, y_test = train_test_split( X, ...
&small(一般に、train は訓練データ、test は評価用のテスト...
&small(関数モデルを y = f(X) と書いた場合の、X が説明変数...
&small(一般に ベクトルである X は大文字、値である y は小...
-3. アルゴリズムの指定と学習
clf = svm.SVC( gamma=0.001 )
clf.fit( X_train, y_train )
&small(clf は一般に classifier(分類器)の略です。);
-4. モデルの評価
accuracy = clf.score( X_test, y_test )
print( "正解率 {accuracy} ")
predicted = clf.predict( X_test )
print( metrics.classification_report( y_test, predicted ...
&small(predict は「予測」の意味です);
~
~
**代表的な機械学習の手法
***教師あり学習
-''分類''|Classification
--[[LogisticRegression]]
--LinearSVM
--[[DecisionTree]]
--[[RandomForest]]
--[[SupportVectorMachine]](SVM)
--GradientTreeBoosting
--NaiveBayes
--[[NeuralNetwork]](Supervised)
-''回帰''|Regression
--[[LinearRegression]]
--RidgeRegression
--Lasso
// &small(入力に無視して良い変数が混じっている)
--SVR
--BaggingRegressor
--GradientBoostingREgressor
~
***教師なし学習
-''クラスタリング''|Clustering
--[[k-means]]
--MeanShift
//--VBGMM
--GaussianMixtureModels(GMM)
--SpectralClustering
-''異常値検知''|Novelty and Outlier Detection
--Isolation Forest
--Local OutlierFactor
--One-Class SVM
-''次元削減(圧縮)''|Dimension Reduction
--[[PrincipalComponentAnalysis>Statistics/PCA]](PCA)
--SpectralEmbedding
// その他
//-SGD (Stochastic Gradient Descent)
//-最近傍・k近傍法 (Nearest Neighbors)
//-ガウス過程(Gaussian Processes)
//-十字型分解(Cross decomposition)
//-アンサンブル学習(Ensemble methods)
//-マルチクラス・マルチラベルアルゴリズム(Multiclass and ...
//-特徴量選択(Feature selection)
//-半教師あり学習(Semi-Supervised)
//-アイソトニック回帰(Isotonic regression)
//-キャリブレーション(Probability calibration)
//--Neural network models (Unsupervised) )
//--Biclustering
//--共分散推定(Covariance estimation)
//--密度推定(Density Estimation)
//--Isomap
//-t-SNE
~
~
**データセット
-一般データセットAPI (General dataset API)
-トイデータセット (Toy datasets)
-リアルワールドデータセット (Real world datasets)
-生成データセット (Generated datasets)
-その他 (Loading other datasets)
~
~
ページ名: