ニュース
» 2021年09月03日 07時00分 公開

テキストマイニングとは? 自然言語処理との違いや手法、活用方法を解説IT用語3分リーディング

テキストマイニングとは、データマイニングのうち文章を対象としたものを指す。定性的な文章をAIなどで解析して定量的な情報を抽出する。

[キーマンズネット]

サマリー

  • テキストマイニングの手法と目的
  • テキストマイニングサービスの活用方法
  • テキストマイニングの関連用語

 テキストマイニング(text mining)とは、データマイニングのうち文章を対象としたものを指す。一般的には、手作業では処理しきれない量のテキストデータをAI(人工知能)などで解析し、単語の判別や分類をして定量的な要素を抽出する。それによってヒューリスティック(発見的)な知識を獲得することを目的とする。

 従来、日本語は文法のゆらぎの大きさなどが課題となって形態素解析などが困難とされてきた。しかし昨今は自然言語処理(NLP: Natural Language Processing)の発展に伴って実用的な分析が可能になり、テキストマイニングも簡易な分析を実行する無料サービスや企業向けに高度なデータ分析を提供するツールなどが存在する。

 テキストマイニングは2000年前後から研究が活発化し、数学や統計学、言語学、社会学、心理学、認知学など多岐にわたる分野を網羅する技術として活用の模索や論文の発表が続いている。

テキストマイニングの手法と目的

 テキストマイニングは定性的なテキストデータからヒューリスティックな知識を獲得することを目的として利用される。複数の手法があり、例えば以下のような手順で実行される。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。