LogoMark.png

DataMining のバックアップ(No.1)


データマイニング

DM|Data Mining

データマイニング(Data mining:DM)とは、大量のデータに様々な解析手法を適用することで、役立つ可能性のある未知の知見を抽出する発見的(heuristic)な技術のことです。

歴史的には、1980年代にリレーショナル型データベース(昨今の代表格はMariaDB, MySQL)と操作用言語SQLが登場して以降、KDD(Knowledge Discovery in Databases)という語とともに、その有用性が注目されるようになりました。

1990年代以降、データ量の爆発的増大に伴って、ビッグデータを処理する手法として「データサイエンス」、「データマイニング」のという言葉が現れ、統計解析、人工知能の分野での応用がなされています。

マイニングの元の意味は「地中の鉱物などを掘り出すこと。採掘」。例えば、テキストデータを対象とするものをテキストマイニング、ウェブページを対象にしたものをウェブマイニングなどと言います。

CONTENTS


解析手法

頻出パターン抽出

分類(クラス分類)

回帰分析

クラスタリング

APPENDIX

関連ページ