メディア

AI-OCRは「手書き文字」をどこまで正確に読み取れるのか

AI-OCRの読み取り精度は既存のOCRと比べてどこまで実用水準に達しているのか。3つのAI-OCR製品を使って、個人差が大きく識別が困難とされる手書き文字の認識率の違いをMM総研が検証した。

» 2019年08月21日 10時00分 公開
[キーマンズネット]

 紙データのデジタル化を担うOCR領域において、AI(人工知能)援用が注目を集めている。いわゆる「AI-OCR」だ。

 従来型のOCRであっても活字の読み取りに関しては、きれいにスキャンされていれば9割以上の精度で文字を正しく認識する。AI-OCRには、ディープラーニングなどの機械学習の成果を用いることで手書き文字の読み取り精度の改善が期待されている。

 MM総研の調査(注1)によれば、AI-OCRを導入済みの国内法人は9.6%だった。「利用に関心がある」と答えた法人は51.9%に達し、業種別にみると卸・小売業、製造業、官公庁など手書き帳票が大量に発生する業種で強い導入意向が見られる。

AI-OCRの利用状況 AI-OCRの利用状況(出典:MM総研)

 同社は「AI−OCRは、RPA(Robotic Process Automation)と組み合わせることで、オフィスにおけるデータ入力作業の生産性向上につながるとして注目されている」と分析する。導入済み企業に効果を尋ねたところ、「データ作成に要する時間(を削減できた)」(85.7%)、「ミスの発生率(を削減できた)」(82.1%)、「当該業務に必要な人員数(を削減できた)」(78.6%)といった回答が得られた。

AI-OCRの導入の効果 AI-OCRの導入の効果(出典:MM総研)

注1 MM総研「国内法人のAI-OCR導入実態調査(2019年6月実施)」

全業種を対象に「働き方改革」「オフィス業務改革」に関心の強い国内法人のホワイトワーカー1000人を対象に、MM総研がオンラインアンケートで実施した(調査期間:2019年6月21〜24日)。


AI-OCRの「手書き文字」読み取り精度を検証した

 MM総研は、日本市場で流通する3つのAI-OCR製品を対象に手書き文字の読み取り精度を検証した。対象としたのは「AIよみと〜る」(NTT東日本)、「tegaki」(Cogent Labs)、「LAQOOT」(ユニメディア)だ。

 検証のために、手書きで必要事項を記入した3種類の帳票を100枚ずつ用意し、300枚分のPDFのデータを作成した(「正規データ」と呼称)。用意した帳票は、架空の人物プロフィールなどを記入した「寄附金税額控除に係る申告特例申請書」「支払金口座振替依頼書」「発注書(一般的なもの)」だ。これらに加えて、それぞれの帳票で任意の30枚に対して意図的にゆがみや汚れを与えた「歪みデータ」(合計90枚)を作成した。

 なお、一般的なOCR製品との比較検証のために「Googleドライブ」(Google)、「Acrobat DC」(Adobe)、「DocuWorks 9」(富士ゼロックス)で、正規データ(300枚)の読み取りを実施した。

 正規データの読み取りは、OCR製品の手書き文字識字率(注2)が34.0〜11.9%だったのに対して、AI-OCR製品は96.5〜80.7%という高い数字を記録した。歪みデータの読み取りはAI-OCR製品しか検証していないが、96.0〜91.5%という結果だった。

AI-OCRの導入の効果 検証実験の結果(出典:MM総研)
AI-OCRの読取例 AI-OCRの読取例(出典:MM総研)

 MM総研は、「正しく読み取れた比率を『手書き文字識字率』として評価した結果、AI-OCRサービスを使うと、既存のOCRと比較して十分な実用水準に達していることが明らかとなった」とコメントする。

注2 手書き文字識字率

MM総研は「各サービスに手書き文字を読み取らせた結果と、目視による結果(正解データ)との一致率」と定義する。


Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。