データ入力業者のノシクミは長時間の残業に悩んでいたが、独自の方法でAI OCRを活用した結果残業が大幅に減り、生産性が2倍になったという。
アナログデータをデジタル化する手段としてAI OCRがある。一方で既存のAI OCRユーザーからは「文字認識の精度が低い」「確認作業の手間がなくならない」といった声が聞かれるのも事実だ。
データ処理などのBPO事業を展開するノシクミは大量のデータ入力業務を抱え、業務を効率化する目的でAI OCRを導入した。しかし、AI OCRを活用しはじめた当初は、くずし字のような手書き文字を読み込めず、文字認識精度は60%程度。「AI OCRは人の代わりにはなり得ない」と諦めかけたという。
ところが同社は、複数のAI OCR製品の試行錯誤をへた結果、高い精度を維持しながら低コストで入力業務を効率化する独自の活用方法を編み出すことに成功した。残業時間は大幅に減少し、生産性は2倍になったという。ノシクミの鳥養純一氏(代表取締役)がAI OCR導入の経緯と活用方法、成果を語った。
ノシクミは主にデータや画像を処理するBPO事業を手掛ける企業だ。データ化事業ではAI OCRを活用して、月間10万枚に上る紙帳票のデータを処理している。
東京と沖縄、ミャンマーに拠点を持つ同社は、ミャンマーで採用した人材を活用する目的で2015年頃からデータ化事業を開始した。しかし「成果を求めすぎた反動で従業員が手を抜き、ミスが多発する事態に陥った」(鳥養氏)ため、OCR製品の導入に踏み切る。
初めは無料のOCR製品「Tesseract」を導入したものの、ボックス内の文字認識にやや難があった。そこでノシクミは「Google Cloud Vision API」や「Amazon Textract」「Azure Computer Vision」といった海外製のAI OCR製品を導入し、これらの製品を入力データの確認作業に利用することにした。
手書きの注文書データを2人の担当者が入力し、2つの入力データが不一致の場合にAI OCRを利用して採用データを決定する。その結果、データ確認のための目視作業を7割削減することに成功した。
しかしこれらのAI OCR製品には「中国漢字と康熙部首の区別ができない」「手書き文字の認識がほぼ不可能」といった弱点があった。加えて2019年頃から手書き文字のデータ化案件が増加したこともあり、ノシクミは再び人力での入力を優先するようになる。
その後クラウドソーシングサービスなどを利用して手書き文字の案件に対応していた同社は、ある大きな案件を受注したことをきっかけに、従業員が長時間の残業を余儀なくされる事態に陥った。鳥養氏は当時の様子を振り返って次のように語る。
「当時は従業員が朝8時から翌朝4時までデータ入力作業に追われるような状況でした。あまりに作業量が多くミスが多発し、現場は大混乱に陥ります。この状況を何とかしなければならないと思った私は従業員に謝罪し、解決のための手段を模索し始めました」(鳥養氏)
鳥養氏は紙帳票を効率的にデータ入力するための手段を探して展示会を訪れた。そこでは国産AI OCRメーカーのOEM製品のデモンストレーションが行われており、同氏は認識精度の高さに衝撃を受ける。
再びAI OCRを活用しようと決意した鳥養氏は、「AI OCRに適した帳票」「AI OCRの機能」「導入によって生じうる課題」「コストパフォーマンス」の4つの観点から導入に向けた調査を開始した。
まずはAI OCRに適した帳票を見極めるために、手書き帳票を「自社様式なのか相手方様式なのか」「急いで書いたのか時間をかけて書いたのか」の2軸で4象限に配置した(図1)。AI OCRでデータ化しやすいのは「自社様式で時間をかけて書いた帳票」であり、申請書やクレジットカードの申込書、質問票などがこれに該当する。
AI OCRによるデータ化には「原稿のスキャン方法」も重要だ。これについて鳥養氏は、「AI OCRの認識精度を上げるためには、原稿は活字なのか手書きなのか、スキャン方法は専用スキャナーか、FAXか、スマホカメラかといった情報を事前に整理して、どんな種類の原稿をどうスキャンするかを事前に考えておくことが重要です」と語る。
さらに鳥養氏は複数のAI OCR製品の機能についても徹底的に調査した。特に意識したポイントが幾つかあった。まずは、読み込める画像の種類と処理単位だ。紙資料をスキャンした場合に、スキャン後の画像形式にAI OCRが対応しているのか、また数ページを一つのファイルとしてまとめて読み込めるのか、あるいは1ページごとに分割しなければならないのかを確認しないと、予期せぬ手間につながる。
画像補正の機能も確認すべきだという。斜めの画像をうまく読み込めない、あるいは元の文章の配置と異なる順番でデータが出力されるといったことがないように、「きちんと画像が補正されるように調整してから導入しましょう」と鳥養氏は話す。
AI OCRの認識の範囲や順番にも着目した。AI OCRが紙面の全文を抽出するのか、表の中の文字のみを取り出すのか、あらかじめ指定したレイアウトに沿って情報を抜き出すのか、さらに紙面の情報を読み込む方向が「上から下の順番」なのか「左から右の順番」なのか、製品によってさまざまだ。「場合によっては、人が読む順番とは異なる方向に情報を抽出した結果、出力した情報がよく分からないものになることがあります」(鳥養氏)
その他、製品によって1つの画像に対する読み込み速度や、同時にアクセスできるサーバの数とそれに応じて決まる同時処理数も検証した(図2)。特に大量の情報を読み込みたい場合は、この2点が出来上がりまでの時間を大きく左右する。
こうした検証を重ねた結果、AI OCR製品は「Vision AI」「LINE CLOVA」「Tegaki」の3製品を導入し、目的別に利用することにした。「Vision AI」は活字の帳票を低コストで大量に処理する場合に適している。「LINE CLOVA」は活字と手書きの帳票を汎用的に高コストパフォーマンスでデータ化することができ、「Tegaki」は手書きの帳票を高い精度でデータ化することが可能だ。
ただ、AI OCRの導入によって新たな課題が生じる懸念もあった。AI OCRの認識結果を確認するためには管理画面にアクセスして、承認や修正作業をする必要がある。その管理画面の操作方法を学習するコストがかかること、画面の仕様によってはクリック数や作業数が増えることによって、AI OCRのメリットを最大化できない恐れがあったのだ。BPO事業者としての競合優位性を高めるために、AI OCR製品の管理画面を利用せず、APIを利用して各製品の機能を自社開発のデータ化システムに組み込むことにした。
さらに、万が一、AI OCRに起因した事故が発生した際に説明責任が果たせるよう、有人での対応を前提にした仕組みを構築し、人力での入力も効果的に続けている。
ノシクミはこうした工夫を重ねることによって、高い精度を維持しながら低コストでデータ入力作業を行えるようになり、生産性も向上した。
「AI OCR導入前は、書類をデータ化する際に、2人が同じデータを入力し、一致しているかを確認、一致していれば採用という『2回入力突合』方式をとっていました。必ず必要だった2人分の入力データのうち1人分をAI OCRが担うことで生産性が大きく向上しました」(鳥養氏)
ノシクミはAI OCRを活用した独自の仕組みを構築したことにより、2021年2月に210時間だった従業員1人当たりの平均業務時間は2022年10月には180時間まで減少し、平均残業時間もひと月当たり10時間未満にまで減少した。さらに2021年2月に2万1500件だった従業員1人当たりの納品データ件数は2022年10月には4万8300件まで増加し、データの総取扱量は2.25倍になった。
こうした成果に加え、ノシクミは効率化で削減された時間を利用して、仕組みの改善や人材のリスキリングを実施している。仕組みの改善について鳥養氏は次のように語る。
「ポイントカードの申込書データをLINE CLOVAとTegaki、人力によってデータ化する案件のコストは当初の想定では1件あたり16.8円でした。しかし予想外の手戻りが発生したことでコストが22.5円にまで膨らんでしまいました。これは100万円の売上に対して200万円のコストをかけていることになります。そこで効率化によって創出された時間で業務フローの改善とシステムの改良を行い、2022年10月の時点でコストを8.8円まで抑えることに成功しました」(鳥養氏)
人材のリスキリングでは、全ての従業員が担当顧客と担当製品を持ち、集客から営業、作業設計、スタッフ教育、データ入力、検査までの一連の工程を担う一気通貫型の人材育成を実施している。鳥養氏は、「一気通貫型の人材育成によって従業員が業務を深く理解するようになり、顧客に対してより望ましい提案ができるようになりました」と話す。ノシクミはリスキリングによって、全ての従業員が顧客の利害調整ができるようになることを目指しているという。
現在のAI OCRは認識精度や業務設計の精度に依存するため、業務を部分最適化するにとどまる。しかし2025年頃にはAIを活用した高度な文書処理技術であるIDP(Intelligent Document Processing)によって業務の全体最適化が可能になると予想される。一方でIDPは大量の文書処理は得意だが、小ロットやオンデマンドの文書処理には不向きだ。
ノシクミはこうした需要に応えるために、AI OCRを利用した社内システムを開発した。システムは顧客から受け取った帳票を仕分けしてAI OCRでデータを読み取り、さらに帳票をコピーアンドペーストが可能なPDFファイルとして保存する。帳票が届いた時点で入力担当者に通知が届き、担当者はPDFを確認しながらAI OCRが誤認識した箇所をコピーアンドペーストで修正する。
鳥養氏は「このシステムによってデータ入力業務の効率化が身近になることを願っています」と語り、セッションを終えた。
本稿は、ITmediaが開催したオンラインイベント「ITmedia DX Summit vol.14 DIGITAL World 2022」におけるセッション「月間10万枚のAI OCR活用で残業はゼロ、生産性は2倍に 〜5製品の試行錯誤で編み出した文字認識虎の巻〜」の内容を編集部で再構成した。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。