文書の検索には、一定の文字列を対象とするテキストマイニングなどの技術が使われるが、通常この場合、検索用のキーワードを辞書化するとか、検索対象の文書をどんな単語や文節で区切るかなどを、人間があらかじめ指示する必要がある。別の言い方をするならば、事前に定義されなかったキーワードによる検索では、欲しい文書がヒットする精度も悪くなるということだ。
企業内には日々、新たな文書データが蓄積されていく。その数は増える一方で、それに伴い定義したキーワードや文節の区切り方なども、随時アップデートしていく必要があるだろう。こうした作業を人手で行うには限界がある。
そこで現在、AIに検索対象となる文書を読み込ませることで、人が指示を与えなくても、より精度の高い検索結果を返すことができるソリューションを提供するベンダーがある。
具体的には、企業の基幹システムにある帳票データや、社内に点在する各部門のファイルサーバ内の文書データ、さらにはグループ企業間などで共有すべきクラウド上にある文書データなどをAIに読み込ませることで、AIが類似キーワードや文書同士の関係などを自動解析するという機能だ。
例えば、片仮名で書かれた「フィンテック」とアルファベットで書かれた「FinTech」を同じものと認識できる。異なる文字列を「同じである」として処理するには、通常であれば、あらかじめ、名寄せ用の辞書やデータベースを用意しておく必要がある。単語や文字列のパターンをうまく設定し、網羅しなければうまく分類できないことが多いのだが、この処理をAIで最適化する。
これによってIT担当者は、事前に各種要件を定義する作業が不要になり、またAIに読み込ませる文書量が増えれば増えるほど、目的の文書を見つけ出す精度は高まる。
キーワードによる文書検索だけでなく、例えばある営業担当者が顧客にプレゼンするための提案書を作成したとき、それをAIに読ませることで、社内に蓄積された文書データの中から、「内容の類似した過去の提案書はこれですよ」とAIに教えてもらうことも可能になる。蓄積された文書を、AIが業務ノウハウに変えるということだ。
過去の提案書を使ったプレゼンの結果がどうだったかまで一緒に知るためには、別途文書データとその結果をひも付ける必要はあるが、少なくとも類似した提案書を参照することができれば、自分が作成した提案書に、先輩たちの知恵を反映することが可能となる。AIベースの文書管理を行うことで、業務の効率化だけでなく、業務の高度化までが実現できるということである。まさに働き方改革の一助となる文書管理ツールの活用メリットだ。
参考までに、先のベンダーが提供するAIを用いた文書管理ツールを使うための準備としては、読み込ませたい文書が保存されているファイルサーバなどのフォルダを指定するだけだ。これでAIが文書データを読み込んで学習し、自動的に解析を行う。
ちなみに文書の学習にかかる時間は、テキスト、PDF、Word、Excelなどのオフィス文書を対象にベンダーがテストした結果として、30万文書で6〜8時間とのことだ。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。