AI-OCRは「手書き文字」をどこまで正確に読み取れるのか
AI-OCRの読み取り精度は既存のOCRと比べてどこまで実用水準に達しているのか。3つのAI-OCR製品を使って、個人差が大きく識別が困難とされる手書き文字の認識率の違いをMM総研が検証した。
紙データのデジタル化を担うOCR領域において、AI(人工知能)援用が注目を集めている。いわゆる「AI-OCR」だ。
従来型のOCRであっても活字の読み取りに関しては、きれいにスキャンされていれば9割以上の精度で文字を正しく認識する。AI-OCRには、ディープラーニングなどの機械学習の成果を用いることで手書き文字の読み取り精度の改善が期待されている。
MM総研の調査(注1)によれば、AI-OCRを導入済みの国内法人は9.6%だった。「利用に関心がある」と答えた法人は51.9%に達し、業種別にみると卸・小売業、製造業、官公庁など手書き帳票が大量に発生する業種で強い導入意向が見られる。
同社は「AI−OCRは、RPA(Robotic Process Automation)と組み合わせることで、オフィスにおけるデータ入力作業の生産性向上につながるとして注目されている」と分析する。導入済み企業に効果を尋ねたところ、「データ作成に要する時間(を削減できた)」(85.7%)、「ミスの発生率(を削減できた)」(82.1%)、「当該業務に必要な人員数(を削減できた)」(78.6%)といった回答が得られた。
注1 MM総研「国内法人のAI-OCR導入実態調査(2019年6月実施)」
全業種を対象に「働き方改革」「オフィス業務改革」に関心の強い国内法人のホワイトワーカー1000人を対象に、MM総研がオンラインアンケートで実施した(調査期間:2019年6月21〜24日)。
AI-OCRの「手書き文字」読み取り精度を検証した
MM総研は、日本市場で流通する3つのAI-OCR製品を対象に手書き文字の読み取り精度を検証した。対象としたのは「AIよみと〜る」(NTT東日本)、「tegaki」(Cogent Labs)、「LAQOOT」(ユニメディア)だ。
検証のために、手書きで必要事項を記入した3種類の帳票を100枚ずつ用意し、300枚分のPDFのデータを作成した(「正規データ」と呼称)。用意した帳票は、架空の人物プロフィールなどを記入した「寄附金税額控除に係る申告特例申請書」「支払金口座振替依頼書」「発注書(一般的なもの)」だ。これらに加えて、それぞれの帳票で任意の30枚に対して意図的にゆがみや汚れを与えた「歪みデータ」(合計90枚)を作成した。
なお、一般的なOCR製品との比較検証のために「Googleドライブ」(Google)、「Acrobat DC」(Adobe)、「DocuWorks 9」(富士ゼロックス)で、正規データ(300枚)の読み取りを実施した。
正規データの読み取りは、OCR製品の手書き文字識字率(注2)が34.0〜11.9%だったのに対して、AI-OCR製品は96.5〜80.7%という高い数字を記録した。歪みデータの読み取りはAI-OCR製品しか検証していないが、96.0〜91.5%という結果だった。
MM総研は、「正しく読み取れた比率を『手書き文字識字率』として評価した結果、AI-OCRサービスを使うと、既存のOCRと比較して十分な実用水準に達していることが明らかとなった」とコメントする。
注2 手書き文字識字率
MM総研は「各サービスに手書き文字を読み取らせた結果と、目視による結果(正解データ)との一致率」と定義する。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AI-OCRとは? OCRとの違い、選定ポイントと導入の注意点
AI-OCRは、機械学習や深層学習といったAI技術を活用するOCR(光学的文字認識)技術だ。RPAと連携することで自動化の範囲を押し広げるものとして注目が集まる。果たしてその実力とは? OCRとの違いや失敗しない製品選定のポイント、導入の注意点を解説する。 - RPA+OCRで残業はどのくらい削減できる? パナソニック ソリューションテクノロジーの事例に学ぶ
世に先んじてRPAとOCRの連携に取り組み、業務効率化の効果を出したパナソニック ソリューションテクノロジー。その舞台裏には何があったのか。 - RPA、約12万時間削減の裏でロボット停止の嵐――リクルートはどう解決したのか
RPAによって年間で約12万時間を削減したリクルートライフスタイル。しかし、導入当初は「毎日のようにロボットが止まる」という現象に悩まされた。これを解決し、RPAプロジェクトを成功に導くためにしたこととは? - RPA×AI連携を数クリックで――Connected-RPAが実現する世界
大手製薬会社のファイザーが、RPAとOCRの連携で22万時間分もの作業を削減しました。AIとの連携でも大きな成果を上げています。また、ある企業はSAPの2025年問題の解決策としてRPAの活用を考えています。RPAを上手に使っていく上で重要なトレンドを紹介します。