メディア

AI-OCR真の価値は「手入力の解消」ではなく「経営判断の迅速化」にある――対談・Cogent Labs飯沼氏×セゾン情報システムズ小野氏

» 2018年05月24日 10時00分 公開
[相馬大輔RPA BANK]

2021年9月13日、RPA BANK はキーマンズネットに移管いたしました。
移管に関する FAQ やお問い合わせは RPA BANKをご利用いただいていた方へのお知らせ をご覧ください。

RPA BANK

RPA(ロボティック・プロセス・オートメーション)の活用をリードする金融業界では2017年10月以降、日本銀行とメガバンク・地方銀行の担当者らがRPA導入時の課題と解決策について定期的な議論を行っている。実は、この席上で繰り返し指摘されているのが、わが国のオフィスで多用される“紙”の問題だ。

「定型作業をRPAで自動処理する前の段階で、紙文書をデータ化する手間がネックとなって活用範囲が思うように広がらない」という状況は、業界・業種を問わず多くの導入企業にも共通している。日本独自の「はんこ文化」が根強いこともあり、特に契約や決裁に関しては当分の間、紙を介した事務作業が残される可能性が高い。そのためRPAをはじめとするデジタルデータをベースにした事務処理への移行で業務の効率化・高付加価値化を図るには、両者の間をつなぐ高精度のOCR(光学文字認識)が不可欠の存在となる。

日本企業の生産性向上とイノベーションに、RPAとOCRは今後どのような形で貢献していくのか。AIを活用した日本語OCRを開発する株式会社Cogent Labs(コージェントラボ、東京都渋谷区)の代表取締役・飯沼純氏と、データ連携プラットフォームなどを提供する株式会社セゾン情報システムズ(東京都港区)の常務取締役CTO・小野和俊氏に聞いた。

(左から)株式会社Cogent Labs代表取締役・飯沼純氏と、株式会社セゾン情報システムズ常務取締役CTO・小野和俊氏

OCRの「失敗」イメージをAIが一新する

−日本語OCRは40年近い歴史を持つテクノロジーです。ここへ来て、再びその重要性が注目されている要因としてはRPAのほか、長足の進化を遂げたAIを応用して読み取り精度が格段に上がったことも大きいようですね。

小野: ええ。実はわれわれセゾン情報システムズがコージェントラボとの協業を始めたのもAIに再度注目が集まったことがきっかけでした。

ディープラーニング(深層学習)によるAIの進化が話題になったのを機に「これで強力な手書き文字認識が現れるのでは」とリサーチを始めたところ、圧倒的に精度が高いReactive(コージェントラボの旧社名)の製品を見つけました。OCRは単体での導入も可能ですが、「読み取った内容をいったん確認してからアプリケーションに登録する」など、ワンクッションを挟める形で後続の処理と一体のソリューションを構築できれば利用価値がさらに高まると考えました。そこで、われわれのパッケージ製品であるファイル転送ミドルウエア「HULFT」やデータ連携ソフトウエア「DataSpider」との連携機能を準備しだしたというのが、今日に至る流れの始まりです。

以前のわれわれのように、AI-OCRの認識率を初めて知って驚く人は多いのではないですか?

飯沼: そうですね。ただAI-OCRというものに対して、最初は懐疑的な反応が圧倒的に多いです。これは一般的なAIの性質として、その判断が「なぜそうなったのかの検証が困難である」という側面があることに加え、「OCRを試したが成果に満足できなかった企業」が相当数にのぼるという過去の経緯があるためです。われわれのAI-OCR「Tegaki」をご紹介するときも「特定のテキストで最適化したときの認識率を発表しているのでは」「こういう文字は読めないでしょう」などと、かなり“意地悪”なことを言われています(笑)。

ですから私は、もっとも透明性の高い方法で性能をご理解いただくようにしています。訪問先で、先方の方に何か書いていただき、それをすぐスキャナ経由でTegakiの読み取りにかけるんですね。認識の結果が出ると、その精度の高さに「待てよ」と。それまでの雰囲気が一変します。

−「論より証拠」ですね。数あるAI-OCRの中でも、特にTegakiが高い認識率をアピールできているのは、どこに違いがあるのでしょうか。

飯沼: 「文字単体だけでなく前後の文脈も判断材料に使う」といった技術的側面のほか、大きな要因となっているのが、AIを学習させるデータの「量」と「多様性」です。

手書き文字と一口に言っても、例えば保険の申込書のように比較的きちんと記入されるものと、アンケート用紙のように半ば走り書きされるものでは、特徴が全く異なります。ユーザー企業の協力を得て、こうした多岐にわたる手書き文字のサンプルをAIに投入してきたことで、ほぼどのような導入環境でも早期に一定水準以上の認識精度を出せるようになりました。

6社で本格運用間近。手入力の外部委託とコスト差が縮まりつつある

−クラウドサービスで提供されるTegakiが読み取ったデータを受け取り、次の工程を担うシステムに素早く簡単につなぐためのツールが、DataSpider のアドオンとして近く製品化されるとの発表がありました。現在の開発状況はどうですか。

小野: セゾン情報システムズ社内でのテスト運用に加えて、6社での検証も順調に進んでおり、本格導入と製品化まであと一歩というところです。

このソリューションの具体的な用途ですが、社内のテストでは手書きアンケートの集計作業のほか、ファックスで受信した支払通知に基づく入金の自動消込などでテストを行っています。他の6社では、金融系の企業が顧客から送られてくる暗証番号登録ハガキの処理に導入を検討し、流通系の企業では仕入伝票のデータ取り込みへの応用が進められています。

飯沼: 私はかつてCRM(顧客関係管理)ソフト大手の日本法人に勤めていたので、データ連携の分野で大きなシェアを占めるDataSpiderは当時からよく知っていました。そこで思うのですが、DataSpiderとRPAツールでは、機能的に重なる部分もありませんか。

小野: おっしゃる通りです。Tegakiから受け取ったデータを整理して他のシステムに送る、あるいはデータ受信と同時に別のアプリケーションを起動して特定の処理を加えるといった工程の自動化は、DataSpiderでもRPAツールでも実現可能です。操作性の面でも、ドラッグアンドドロップで多様な連携先を設定できるDataSpiderと同様、ノンプログラミングで直感的に実装できるRPAツールは多くあります。

両者の大きな違いは、ターゲットとなる連携先です。DataSpiderはデータ連携に特化したソフトとして主要なCRMやグループウエア、データベースなどに対応し、Excelとの連携にも優れています。データ連携のための専用のツールなので実行パフォーマンスや動作の安定性にも優れています。その一方で、APIや外部連携機能が提供されていない独自開発のシステムやWebサイトとの連携となると、RPAツールに軍配が上がります。

Tegakiを導入する企業の環境によって、メインで使うのがDataSpiderとRPAツールのいずれになるかは異なると思いますが、多くの場合、両者を併用して社内のデータ処理を分担する構成が最適解になると考えています。

―文字情報をデータ化する手法としてはOCRのほか、手入力を社外に委託する選択肢もあります。

飯沼: はい。現実問題として、手入力の外部委託とOCRは競合しており、コスト面でも厳しく比較されますが、DataSpiderとの連携にあたってAI-OCRの運用をきめ細かくチューニングしておくことで、十分競争力が持てるという手応えをつかんでいます。

Tegakiでは、読み取り結果に合わせて精度の確実性もパーセンテージで表示されます。この数値が一定以上を保てるか、どの程度の数値まで許容されるかを踏まえて実装を進めていきますが、例えば都道府県名から番地までの住所記入欄をいくつかに区切っておくだけでも、確実性の高い部分を抜き出すことが可能です。また、申込書の備考欄やアンケートの自由記入欄は、一字一句の誤りも許されない住所氏名とは異なるので、多少精度が不足している読み取り結果も許容範囲にすることができます。

こうしたAI-OCRで実用上十分な精度を得るためのチューニングとして、ふさわしいデータ処理を設定する上でも、DataSpiderやRPAツールは重要な役割を果たすと思います。

データ連携では「スモールスタート」を選ばない

―新たなテクノロジーを導入する際は、小さく始めて大きく育てる「スモールスタート」がほぼ定石になっています。今後AI-OCRを起点としたデータ連携を検討する企業も、やはり小さい規模から少しずつ進めるのがよいでしょうか。

小野: まずOCRの運用を確立した後、データの連携先を検討する段階では、あえてスモールスタートを選ばなくてもよいと思います。

なぜなら、Tegakiと組み合わせたDataSpiderやRPAの活用は、既存のITインフラや業務プロセスを大きく変えずに採り入れることができ、事後のカスタマイズも柔軟に行うことができるからです。導入に伴うリスクが低いのに、効果も限定されてしまうスモールスタートを選ぶ必然性があまりないということです。

むしろ、多くの企業には現場からもっと早く・豊富に手に入れたい情報があり、複数の部門やテクノロジーを介する間に伝わらなくなる状況を何とか変えたいと思っているはずです。そうした部分にAI-OCRとデータ連携を活用すれば、フロントエンドで発した情報がバックエンドやマネジメント層まで一気通貫に伝わり、絶大なインパクトが得られます。

AI-OCRを単に「手入力からの代替」に留めるのではなく、導入のインパクトを最大化できる用途で使うことが重要というのが私の考えです。飯沼さんはどうですか。

飯沼: 同感です。これまでデジタル化されていなかった、あるいはデジタル化されるまでタイムラグがあった情報をリアルタイムに参照し、ただちに経営に反映することもできるのですから、その可能性をぜひ生かしていただきたいと思います。

AI-OCRは、進化したAIをビジネスの現場で生かせるテクノロジーだと自負していますが、Tegaki単体を自社で普及させるには限界があることも痛感しています。その意味で、後続の業務プロセスを担うデータ連携分野のプレーヤーとタッグを組めることに深く感謝しています。DataSpiderのようなプログラミング不要のツールから気軽にAIを使えるようになることで、特にITのスペシャリストが社内に少ない中小企業にも新たなビジネスチャンスが広がることに期待しています。

―単なるデータ入力の自動化で終わらない、全社に及ぶ一大イノベーションの前触れを感じました。本日はお忙しいところ、ありがとうございました。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。