データマイニング

読み方 : でーたまいにんぐ

データマイニングとは

データベースなどに大量に蓄積したデータからビジネスに役立つ傾向やパターンなどを導き出すこと。これを実現するツールがデータマイニングツールである。単純なデータの照会/検索だけでは見つけることのできないデータ間の“埋もれた”関連性を自動的に導き出す。百貨店の購買データから頻繁に購入される商品の組み合わせを見いだしたり、電話会社における顧客の解約者層のデータから解約の理由を導き出す、などの応用例がある。

データマイニングの主な手法として、統計解析、決定木、ニューラルネットワークなどがある。統計解析では、関連性が高い組み合わせを見いだす相関分析が多く使われている。これはバスケット分析などの用途に適している。決定木は、データの項目の属性にしたがって二つのグループに分割していく手法。顧客層の分類などに適している。ニューラルネットワークは、データのパターンをネットワーク構造に“学習”させて、新しいデータがどのような分類に属するか判断する手法。クレジットカードの不正利用の判断などに使われている。

データマイニングを実行するためには、データウエアハウスやデータマートを整備する必要がある。これらの整備の良否によって、有用な結果が得られるかどうかが決まる。

出典:ITpro「今日のキーワード」(C)日経BP社

[2010年 1月 1日 公開]

お役立ち情報満載!「資料ダウンロードまとめサイト」のご案内