テキストマイニング

読み方 : てきすとまいにんぐ

テキストマイニングとは

大量の文書を分析し、文書中に埋もれている傾向や特徴を発見する技術。現在では主に、アンケートや寄せられた苦情、その他の社内文書を分析対象として、マーケティングやナレッジマネジメントの分野で使用されることが多い。最近ではテキストマイニング支援ソフトの登場により、手作業よりも早く、客観的な文書の分析が可能になった。

一般的にテキストマイニングは、まず対象となる文(テキスト)に形態素解析を施し、キーワードの出現頻度やキーワード間の関連度を解析し、傾向や特徴を分析する、という手順を踏む。形態素解析とは、日本語を品詞ごとに分解する方法。「きれいな花が咲いた」という文の場合、「きれいな/花/が/咲い/た」と分解する。続いて、形容詞や名詞などのキーワードを抽出し、キーワードの使用頻度や関連度を計算する。関連度は、あるキーワードと他のキーワードがどの程度関連しているかを表すものだ。最後に、キーワードの使用頻度や関連度を統計解析し、その結果から文書の傾向を導き出す。

インターネットの発達により、Web経由で自由回答方式のアンケートが簡単にそして大量に取りやすくなったこと、社内文書の電子化が進んでいることなどを背景に、テキストマイニングの需要が高まりつつある。

出典:ITpro「今日のキーワード」(C)日経BP社

[2010年 1月 1日 公開]

大塚商会の法人向け通販サイト(たのめーる)のご紹介