自然文検索

読み方 : しぜんぶんけんさく

自然文検索とは

話し言葉のような自然な文章を使って、必要な情報を探し出す検索方法のこと。文章に含まれるキーワードを抽出し、それを基にデータベースやインターネット上のドキュメントを検索する。キーワードとなる単語を考えなくても、適切なドキュメントを見つけることができるというメリットがある。

自然文検索は、キーワード抽出と全文検索、スコアという大きく三つの機能で実現する。最初のキーワード抽出機能は、文章に含まれる単語を品詞単位で細かく分割し、品詞を判別しながら特徴的な単語をキーワードとして抜き出す。二つ目の全文検索機能は、データベースやインターネット上にあるドキュメントの全文と、キーワード抽出機能で抜き出した複数のキーワードを照らし合わせて、少なくとも一つのキーワードが出現するドキュメントを見つける。三つ目のスコア機能では、キーワードが出現する頻度や、同時に出現するキーワードの数によって、全文検索機能で見つけたドキュメントの重要度をランク付けする。

自然文検索の典型的な応用例は、ナレッジマネジメントである。業務ノウハウの共有を促進する目的でナレッジマネジメントを実践するとき、自然文検索が可能なシステムを導入する企業が多い。

出典:ITpro「今日のキーワード」(C)日経BP社

[2010年 1月 1日 公開]

お役立ち情報満載!「資料ダウンロードまとめサイト」のご案内