メディア

AI-OCRリーディングカンパニー3社が語る! 現状とこれから

» 2021年01月20日 10時00分 公開
[元廣妙子RPA BANK]

2021年9月13日、RPA BANK はキーマンズネットに移管いたしました。
移管に関する FAQ やお問い合わせは RPA BANKをご利用いただいていた方へのお知らせ をご覧ください。

RPA BANK

本特別セッションでは、AI-OCRのリーディングカンパニー3社に登壇いただき、導入・本格展開を進める上での課題に対する対処策やRPAとの連携による業務自動化、先端企業の事例などについて語っていただきました。

■記事内目次

  • 登壇者
  • AI-OCR導入企業が増える一方で、導入に踏み切れない企業も
  • RPAとAI-OCRの連携でより業務自動化が進む
  • まず試してみることで、最適なAI-OCR製品が見つかる
  • AI-OCR適用業務の見つけ方、スケールの仕方
  • 今後AI-OCRはどのように進化していくのか
  • 各社の今後の戦略や方向性

登壇者

左からモデレーター Peaceful Morning株式会社 代表取締役社長 藤澤 専之介氏、スピーカー ABBYYジャパン株式会社 代表取締役 小原 洋氏、AI inside 株式会社 執行役員CRO 事業開発本部長 梅田 祥太朗氏、株式会社Cogent Labs プロダクトマネジメント 執行役員 VP of プロダクトマネジメント・マーケティング アルバート・ジャオ氏

藤澤専之介氏(Peaceful Morning株式会社 代表取締役社長): 本セッションはAI-OCRのトップベンダーである3社を招いてのセッションになります。初めにモデレーターである私の紹介をします。Peaceful Morning株式会社の藤澤です。弊社は、月額5万円からのRPAサポートサービスである「Robo Runner」をはじめとしたRPA関連サービスを展開している会社です。それでは皆さん自己紹介をお願いします。

小原 洋氏(ABBYYジャパン株式会社 代表取締役): ABBYYジャパン株式会社の代表を務めている小原です。ABBYYは創業30数年のソフトウェアベンダーですが、日本では6年足らずとまだ歴史が浅い会社です。AI-OCRのみならず、いろいろなプロセスを可視化するツールの提供を行っています。本日はよろしくお願いします。

梅田祥太朗氏(AI inside 株式会社 執行役員CRO 事業開発本部長): AI inside株式会社で執行役員CROを務めている梅田です。弊社ではAIを用いたOCRサービスのDX Suiteを展開していて、現在は1万3,000社近いお客さまにご利用いただいています。本日はそちらの提供を通じた知見等の話ができればと考えています。よろしくお願いします。

アルバート・ジャオ氏(株式会社Cogent Labs プロダクトマネジメント 執行役員 VP of プロダクトマネジメント・マーケティング): Cogent Labsのアルバートです。プロダクトマーケティングを担当しています。弊社はOCRエンジンプラスNLP解読のSmartFindにより、お客さまの紙処理のデジタル化から解析まで、あらゆるDXのサポートをお手伝いします。3万円のプランから数億円の大規模DX案件までお手伝いすることが可能です。よろしくお願いします。

AI-OCR導入企業が増える一方で、導入に踏み切れない企業も

藤澤: 本日はお三方にいろいろな質問に答えていただければと考えています。AI-OCRを導入する企業が日本全国で増え、非常に盛り上がっている状況ですが、AI-OCRに対する世間やお客さまの反応にはどのようなものがありますか? 初めにAI insideの梅田さんからよろしくお願いします。

梅田: 我々は2017年11月にプロダクトをリリースしてから、おかげさまでかなり多くのお客さまに使っていただいています。基本的には楽になった、溢れていた業務がきちんと回るようになったという声が非常に多いです。

また弊社のツールだけではなく、他社のツールも併せて使うことで、業務効率化の観点で働くことができるようになり、従業員のモチベーションアップにつながったという声が最近は増えてきています。今までずっとルーティンワークをしていた方が、AI-OCRとRPAを組み合わせることで自発的に業務改善に取り組むようになり、その個人の成長を会社が喜んでいると感じます。

藤澤: ありがとうございます。次にCogent Labsのアルバートさんからお願いします。

アルバート: AI-OCRが市場に登場した2、3年前から、これまでの重複的な作業が効率化できるようになったという声をいただいています。ただ最近は、従来の活字や手書き文字の認識だけでなく、さまざまな種類のフォーマットや帳票にもっと柔軟に対応してほしいというニーズが非常に増えています。OCRのベンダーとして、お客さまの声に応えられるように引き続き頑張らなければならないと強く感じています。

藤澤: ありがとうございます。続いてABBYYジャパンの小原さんからお願いします。

小原: おかげさまでお客さまからの評価は非常に高いです。最近になってOCRを使い始めた方もいらっしゃいますが、もう何年も前から使いたいと思っていたものの、技術が追いついていないため効率化ができなかったお客さまが、技術の進化に感動し「いいね」と言ってくださることもあります。

実際の効果としては梅田さんがおっしゃったように、時間の削減や作業のスピードアップなどの数値化ができる部分もありますが、それ以外にもミスを減らすことや、部門間のコミュニケーションの向上、ガバナンスの強化などを実現した例があります。我々のお客さまの花王様からはそのような新しい評価も得ています。

本日はAI-OCRがテーマになっていますが、我々はAIで全てが読み取れるとは考えていません。AIには良い部分がありますが、人の助けを借りなければならない部分もあります。ABBYYはその両方の良い部分をミックスしてベストなパフォーマンスを出していくことで、お客さまから高い評価を得ています。

藤澤: 続いてRPA BANKさんとアビームコンサルティングさんによる調査レポートの結果を用いながら、皆さんに質問していきたいと思います。

調査結果によると、AI-OCRの導入を検討している会社がここ半年ほどで大幅に増えていることが分かっていますし、実際に導入する会社も増えています。その一方で導入に尻込みしている会社もあります。なぜ導入に踏み切れないかというと、例えば業務改善や業務改革を進めてからAI-OCRを導入したいと考えていることが理由として挙げられるようです。この点に関してお客さまの課題をどのように感じ、それに対してどのように対処していけばよいと考えますか? アルバートさんからお願いします。

アルバート: 私はこの課題には3つの背景があると考えています。1つは業務ワークフローの改善です。AI-OCRだけで業務の効率化を成し遂げるのは難しいです。お客さまの業務を理解・分析して、どのようにソフトウェアを活用するかを考えるのが最も重要です。2つ目はデータの整理です。どこにあるどの帳票をデジタル化し、その後どのように活用をするかを考えることは、お客さまにとって戦略的に非常に大事です。3つ目は、今市場に出回っているOCR製品はそれぞれに特性があり、1社で何でもできる状況ではありません。ツール選定にハードルがあるのが現状なので、この3つを考慮する必要があるのではないかと考えています。

藤澤: ありがとうございます。小原さんはいかがですか?

小原: OCRから少し話が逸れますが、業務の可視化や分析をしなければならない時、弊社はプロセスマイニングと呼ばれるプロセスを可視化するツールを使っています。お客さまが実際にそのツールを使って業務を可視化し、今後どのようにすればよいかをデータドリブンできちんと分析をし、目標を掲げて実際にOCRを導入していく例が多いです。何でもかんでもOCRで自動化をすればよいわけではありません。

もう1つの課題はAI-OCRの読み取り精度です。先ほどアルバートさんが言われていたように、自社で全てのことができるわけではありませんし、AIで全てを解析をするのではなく、AIプラス人のヘルプでより高精度な成果を出すことが重要だと考えています。

藤澤: ありがとうございます。続いて梅田さんはいかがでしょうか?

梅田: AI-OCRを導入をするにあたっての選定プロセスには、大きく2パターンがあると考えています。1つは現場部門で業務が回らない、忙し過ぎて何とかしたいという、OCRありきで考えるケースです。弊社のお客さまにも1カ月から2カ月程度検討され、大企業からすればそれほど大きくない金額なので始めてみようとテストをされてそのまま導入し、今は現場部門で使っていただいているケースがあります。このケースは開始が早く、定着もそれほど時間がかかりません。

その一方で最近増えてきているのは、RPAが一通り終わった中でアナログデータの壁にぶつかり、RPAをこれ以上進めていくのであればOCRを導入しなければならないと検討を始めるケースです。これは大企業に非常に多いのですが業務整理がなかなか進まず、AI-OCRに対して良い印象を持っているものの、投資対効果が出せずに決め切れていないケースがあるのではないかと思っております。RPAの時は皆さん工数をかけてコンサルタント会社も利用して導入をしていましたが、OCRは難しくなさそうに見えて、業務を全て変えようとするのと同じぐらいの工数がかかる面があります。

仮説としてRPAがここまでのブームになった理由は、RPAを導入できる会社がたくさんあるからです。いろいろな会社にRPAのノウハウがありそれぞれに強みがあるので、自分が困っていてもどこかの会社がその困りごとを解消してくれますが、ITを導入する立場のSIerやベンダーは、自社でOCRを使っているケースが少ないです。ITの会社であり、OCRをそれほど使っていません。

その一方でRPAは自社でもある程度は使っているので、自分たちで培ったノウハウをお客さまにそのまま提供することができますが、OCRはその段階にはまだ到達していないのではないかと感じます。結局は業務とツールの両方がないと、業務整理はなかなかうまくできません。我々も含めてもう少し自社利用をきちんとして、OCRのノウハウをためて展開していく必要があるのではないでしょうか。

我々のお客さまでも、BPOの会社などは非常にマニアックな使い方をしています。我々が考えていなかった使い方といいますか、裏技的なハックをしていると言えるかもしれません。最近ですと、我々の代理店であるNTTデータさんは自社のBPOで我々の製品を使っており、恐らくそのノウハウ等により提案をされているのではないでしょうか。自社でも使ってみて効果を出してから提供を進めると業務整理がさらに進み、先ほどのような課題がクリアされていくのではないかと感じました。

藤澤: 具体的にどのようなことをしていると「ハックをしている」と感じますか?

梅田: 細かい話になってしまいますが、我々が考えていなかったシステムと連携している場合です。例えばCogent Labsさんはまだ聞いたことがありませんが、ABBYYさんと一緒に組み合わせて使っているとか、また、OCRではありませんが、エントリーシステムといわれる日商エレクトロニクスさんや丸紅情報システムズさんが扱っている、旧来あったデータ入力の仕組みと我々の仕組みをマージさせ、なるべく人のチェックを入れなくて済むようにしているケースが挙げられます。我々も決して自分たちだけで全てが解決できるとは考えていないので、いろいろな製品を組み合わせるのは良いことだと思います。

アルバート: 弊社のお客さまも複数社のエンジンを使っています。BPOでは恐らくABBYY社とAI inside社の製品を導入していて、2人のパンチャーと1人のチェッカーで利用しています。2人のパンチャーは今まで1社のOCRをリプレイスしようとしていましたが、複数の製品を入れて、なるべく人間がタッチをする行為を減らして自動化していく使い方もあると思います。

RPAとAI-OCRの連携でより業務自動化が進む

藤澤: RPA BANKさんとアビームコンサルティングさんの調査レポートで、RPAを導入している会社と導入していない会社のAI-OCRの導入率を見た時に、RPAを導入している会社の方がAI-OCRを導入している比率が高いです。なおかつ既に検討をしている会社の割合も大きいです。RPAとAI-OCRを連携することで業務自動化の範囲がより広くなることが期待されますが、実際の事例や具体的な成果について教えてください。小原さんからお願いします。

小原: RPAの連携事例はたくさんあります。公開事例としては、1つはNTTコミュニケーションズ様が、請求書のバックオフィス業務でデータの入力からデータの出力、会計システムへのつなぎ込みとその前後でOCRとUiPathを使っています。今までは業務全体の約30%をRPAで自動化できていましたが、残りの紙に関連するフローが年間で約1,000社分ありました。その後OCRを導入することによって、さらに約4,000時間を削減することができています。また、花王様もUiPathとERPを連結してトータルで効果を出しています。

ABBYYは日本だけではなく、グローバルでいろいろなアライアンスを組んでいます。UiPathやBlue Prism、日本だとWinActorと組んで、RPAの中でOCRをアクティビティとして呼び出せるようにしています。またコネクタという部品を提供することにより、例えばOCRをかける、出力する、検証するなどのフローが簡単に設計できるようになっています。

これはRPAとの連携に反する話かもしれませんが、実はABBYYの製品はRPAがなくても処理できる例もあります。RPAにもいろいろな使い方がありますが、一番多いのはデータの加工でしょうか。ABBYYの製品ではデータを取り出した後、システムにつなぐために入れ替えや並べ替えをすることが可能です。例えば取引先ごとや請求書の日付ごとにソーティングをすることや、請求書と注文書のペアが別々に入っていた時にそれを中で並べ替えて種類ごとに出力するといったことが可能で、OCRのシステム単体でワークフローやデータ加工も含めて実現している例があります。

藤澤: 従来のAI-OCRのイメージと比べると、できる範囲がかなり広がっている印象です。梅田さんはいかがでしょうか?

梅田: 我々も請求書での利用が比較的多いです。ブリヂストンファイナンスさんの事例では、請求書業務でUiPathとの連携を行っています。また、UiPathに限らずBizRobo!やWinActorなどのRPAと連携できるコネクタを提供することで、プログラミングをほとんど行わなくてもRPAが自動でOCRを実行して、抽出されたデータを転記することができます。

先ほど言ったことと重複するかもしれませんが、RPAを導入している会社では、ある程度業務の効率化をする土台ができ上がっているわけですよね。例えば定例のRPA推進担当者のミーティングで、上司が「面白いものがあるから今15分だけ時間をください」と言って、RPA推進担当者にOCRの話をしている会社が比較的多いです。大抵RPAを使い尽くして次にOCRを使いたいと考え、いろいろな部署で検討がなされます。1つの部署だけで検討するのではなく、いくつかの部署で一斉に確認をして簡単に触れてみることでどこの部署で使えそうかが分かり、導入に対するハードルが下がります。これがRPAを導入している会社にOCRが広がりやすい理由の1つだと感じています。

藤澤: ありがとうございます。アルバートさんはいかがですか?

アルバート: 社名は非公開ですが、大手の銀行や医療の特に検診関係、最近は結婚式場の申請書などでRPAと連携してシステムを自動化している例があります。RPAと連携するベネフィットとしては、既にお二人が言ったことと重複をしないことを挙げると、紙業務が多いお客さまにとっては、RPAとAI-OCRのコンビネーションは非常に魅力的なようです。RPAだけでは紙を効率的に処理することはできません。それをどのように処理したらよいかというお問い合わせを多くいただくので、RPA各社と組んでお客さまの紙媒体の自動化処理を解決することが弊社の目標の1つです。

まず試してみることで、最適なAI-OCR製品が見つかる

藤澤: トップベンダーの皆さまにぜひ伺いたいのですが、AI-OCRの製品がここ最近でかなり増えています。自社で開発をしているものや、逆にエンジンだけ別の会社のものを積んでOEM的に提供しているサービスも多くあります。そういったサービスが増えている中で、皆さまとしてはどのように製品を選定するのが良いと考えますか。初めに梅田さんからお願いします。

梅田: まずは試してみてくださいとよく言っています。オンプレミス型を除けば、どれも比較的旧来のIT製品に比べると安価に始めることができます。始めやすいということはやめやすいということでもあるので、取りあえず一度触って試した上でいくつか比較し、自分たちの業務に一番合うものを選ぶのがよいのではないでしょうか。それぞれに良し悪しがあるので、自社の業務に対してどのソリューションが適しているかです。例えば手書きか、癖字が多いか、活字や印字された文字が多いか、フォーマットは統一されているのかばらばらなのかといったように、業務によっても使えるOCRは異なってきます。そこはチェックをしてほしい部分です。

これは我々の売りになってしまいますが、サクセスプログラムといわれる1カ月間の検証のプログラムと、その後2カ月間ぐらいオンボーディングで伴走をするプログラムがあります。サブスクリプションは使っていただかなければ意味がなく、契約をして終わりでは1年後に解約されるのが待っているだけです。我々も毎月一定のお金を得るよりは、より多くのお客さまに広く使っていただきたいと考えています。お客さまとのウィンウィンな関係をつくることがゴールなので、そこを目がけてきちんと伴走をします。選定時にこういったアフターサポートの部分も見ていただけるとありがたいですね。

藤澤: 2カ月間サポートしていただけるのですか?

梅田: はい。その後も当然ながらサポートをしますが、2カ月間は独自のプログラムがあり、それを用いて必ず成果を出して、導入から運用に乗せるまでを行います。マニュアルを読んで分からなかったら聞いてくださいというよりは、お客さまの肩をつかんで一緒に走っていく感覚です。お客さまが少し受け身であったとしても、我々がぐいぐいと進めていくので、安心して乗ってきてくださいというプログラムになっています。

藤澤: 分かります。ぐいぐい引っ張ってもらわないとなかなか進まないケースは多いですね。

梅田: はい。“鉄は熱いうちに打て”というわけではありませんが、業務のプライオリティは日々変わります。忙しい方であればあるほど日々難題が降りかかってくる中で、3カ月後も同じことを考えているかといえば、そうではない場合がほとんどでしょう。お客さまが「今この課題を解決したい」と感じた時に、我々がすぐに伴走することが大事だと考えています。

藤澤: ありがとうございます。小原さんは製品の選定の仕方についてはどのように考えていらっしゃいますか?

小原: まずは試してみないと駄目でしょうという意味で、弊社も無償でPoCを設定し実際に確かめていただくことをしています。ABBYYの製品はAIを使っている部分がふんだんにありますが、先ほどお伝えしたように人間が少し工夫をすることで、AIでは読めなかった部分をうまく読み出すことができます。よく例に出すのは明細行です。明細を読む製品はいろいろありますが、例えば罫線のない明細、白と黒の混ざったばらばらの明細や入れ子になっている明細などの複雑な帳票は、現実世界に結構あります。

それをAIでぱっと読み取ることはなかなか難しいと考えているので、そこはやはり人間が実際にどのように読み取るかをツールに教える必要があります。その部分で弊社はパートナーも含めて技術提供を行っています。エンドユーザー側で行っている場合もありますが、必ずしもユーザー部門で全てをまかなうスタンスではなく、できるだけエキスパートに頼りながら、スピード感を持って結果を出す必要があると考えています。

藤澤: 人間ファーストに作られていた帳票を、OCRファーストに変えていくノウハウを持っているわけですね?

小原: はい。究極的にはAI-OCRが読み取りやすい帳票に作り替えることも必要ですが、弊社の製品は人間がどのように明細を読み取っていくか、必要なデータをどの順番でどのように並べるかを表すことができます。それを忠実に再現することによって、読み取り率を格段に上げることが可能になっています。

藤澤: ありがとうございます。アルバートさんはいかがでしょうか?

アルバート: 基本的にお二人が話したことと近いです。AI-OCRはまだ魔法の杖のような存在ではなく、実際のユースケースに合わせて多少のコツが必要とされます。つまりお客さまの業務に合わせてどうするかを一緒に考えなければなりません。例えば対象となる帳票は現場でスマートフォンによって撮影したのか、バックオフィスでスキャナで取り込んだのか、帳票のタイプはどのような文字が入っていてレイアウトは何か等により方法が異なります。

最終的な読み取り精度と業務効率化の成果はつながっています。90%と95%は数字的には5%の差しかありませんが、AI-OCR的には全く違う世界になっています。そこはトライアルやサクセスプログラムやPoCを一緒に行い、効果を実感していただきます。弊社もいろいろな経験を積み、そのノウハウを手厚く提供しており、実際の結果を見て判断していただければと考えています。

AI-OCR適用業務の見つけ方、スケールの仕方

藤澤: RPAの場合、導入初期の1、2部署は自動化したい業務が明確にあり、割とすんなりと自動化が進むようです。しかし部署を増やしたり全社展開をしていく際に、自動化する業務や自動化したい業務をどのように見つけていくかという課題が生じるケースが多いと感じています。AI-OCRの場合にはAI-OCRを適用したい業務はかなり明確にあるものなのか、皆さんのような製品ベンダーが中に入って提案をすることで自動化する業務を増やしていくことになるのかどちらでしょうか。小原さんいかがですか?

小原: 確かにRPAとOCRでは違う部分があります。日本ではOCR導入を考えた時には、ユーザー部門が主導する流れが多いです。アメリカでは文書マネージャーをきちんと据えて全社横断的に紙の業務を自動化していて、そこでナレッジをためてガバナンスをかけていくことが必要だと考えています。COEなどの体制を敷く際に、ABBYYではサポートや技術の提供をして帳票を読み取り、結果を出すことをご一緒させていただいています。その辺りがRPAとOCRではお客さまの体制を含めて、あるいはそのような思考を含めて少し違いますね。

藤澤: 文書マネージャーはどのような部署の方が担当するケースが多いのですか?

小原: アメリカではレコードマネジャーと言っています。20年以上前から存在し、COE的に文書の管理やどのように自動化していくかを見ていきます。日本でもお客さまによっては中央で監督する部署をつくっている会社もあります。例えば弊社のお客さまである日揮様です。文書関係の部署でさまざまな業務を吸い上げて展開するような包括的な活動をしている会社は、全体的に成功しているような気がしますね。

藤澤: それはRPAの主要な担当部署が一緒に行っている形ですか?

小原: 両方あるのではないでしょうか。DX部隊の中にいる場合や、OCRの専任がいる場合もあって、その辺りはまちまちです。

藤澤: 梅田さんはいかがでしょうか?

梅田: 我々のお客さまである生命保険会社さんは、AI-OCR課を情報システム部の中からスペアとしてつくられました。我々がお付き合いをしている中で、AI-OCRの名前が付く課・チームをつくられたお客さまは初めてなのではないでしょうか。そのぐらい全社的に取り組んでいかれるということで、横串でいろいろな部署の業務を見て、この部署で使えるのではないかと判断をしているようです。

そうはいっても当然ながら現場の方、その部署で業務をしている方々が使う気にならないと進みませんので、彼らとコミュニケーションを取ってモチベーションを上げていって、実践できるか試してみましょうと提案する企業もあります。大企業の場合には、DX推進部等が当たり前に用意されているケースが多いです。そこのRPA担当の方が業務ごとに「これはRPA、それはOCR」と判断して、「使ってみましょう」と話をしているケースは多いかもしれません。我々のお客さまの中にはグループ全体での導入を検討していて、まずは子会社ごとに導入の提案をしている企業もあります。

最初の質問に戻ると、適用する業務を見つける場合、OCRはRPAよりもシンプルです。紙を見て入力している業務があれば、OCRをかける価値があるかもしれないということになるので、RPAと比べると業務の洗い出しは少し簡単かもしれません。ただ、その業務にOCRが適用できるかできないかの判断が比較的難しいので、そこは我々が一緒になってここはできる、できないと話をしていく必要があると考えています。

藤澤: ありがとうございます。会社の中でかなり変わってきた気がしますね。

梅田: はい。RPAがつくってくれたカルチャーと言いますか、評価体系が少し変わってきていると感じています。ある意味で我々がそれに後から乗れているわけなので、そこはRPAに対してすごく感謝をしています。

藤澤: ありがとうございます。アルバートさんはいかがでしょうか?

アルバート: 私も基本的にオーガナイゼーションの変更は必要で、そこにAI-OCRとRPAのノウハウを積んでもらうのがベストだと考えています。プラスアルファとして弊社の経験ですと、ツールの使い方や対象となる業務に関して、統括部署と現場で考えが若干異なる場合があります。統括部署が現場に導入する際に抵抗が発生するケースがあるので、セントラルの部署が計画することと、スモールスタートの意味で現場から使ってもらうことの両方が必要だと考えています。

今後AI-OCRはどのように進化していくのか

藤澤: AI-OCRを導入している会社の担当者から、最終的には紙がなくなるのではないかというお話を伺ったことがあります。本日のお話を聞いていると恐らくなくならないでしょうし、AI-OCRを使いこなしていって、1部署だけではなく全社的にどのように取り組んでいくかが非常に大きな問題だと感じています。それも踏まえて今後AI-OCRはどのように進化していくのかについて、ぜひとも皆さまからご意見をいただければと考えています。アルバートさんからお願いします。

アルバート: 中期的には、お客さまはAI-OCRに柔軟性を求めていると考えています。活字や手書きのドキュメント、固定フォーマットや準定型・非定型フォーマット等のあらゆる柔軟性です。さらにRPAと組むことで、他のシステムとの連携や自動化はさらに進化していきます。弊社もより使い勝手が良いAI-OCRを提供するために努力したいと考えています。

長期的に考えているのは、すぐにではありませんが、紙媒体の量を減らすことです。お客さまの目的で考えると、OCRによるデジタル化だけではなく、デジタル化したデータを使って経営やビジネスの判断をする次の部分へつなげていきたいはずです。弊社はNLPエンジンの開発もしており、デジタル化だけではなくデジタル化したデータをさらに活用し、解析やビジネスディシジョンにつなげていきたいと考えています。

藤澤: ありがとうございます。小原さんはいかがでしょうか?

小原: 紙文書はしばらく残ることが皆さんの共通意識であり、理解だと思っています。アルバートさんの話とも通じますが、OCRといった場合、紙文書をスキャンしたイメージに対してデータを取ることが主です。ただ、我々の場合はイメージデータだけではなく、デジタルデータも取ることが可能です。取引先から請求書などがWordやPDF等のデジタルデータのフォーマットで送られてくる場合がありますが、アナログでもデジタルでも電子取引プラットフォームに載せることはできないので、どうしても読み取り技術が必要になります。

弊社はデジタルでもアナログでもその取り組みができますし、同じように自然言語技術のNLPといわれる技術を保有しています。非定型の非構造化された文章を読み取ってデータを取るというよりは、それを解釈してさまざまなインサイトを得ることや経営の判断につなげていくことを目的としています。確かに紙はトータルとして減るのでしょうけれど、それを補うビジネスチャンスはいろいろあると考えています。

藤澤: ありがとうございます。梅田さんはいかがでしょうか?

梅田: 会社の考え方として、紙はなくなっていった方がよいと考えています。どちらかというと我々がデジタルインプットを推進していく必要があり、今の日本の流れからしても間違いなく正しい方向です。デジタルインプット化をどのように進めていくかを、今まさに社内で考えて進めています。そうはいってもお二方が言われている通り、紙はなくなりません。

我々のお客さまである生命保険会社さんが非常に先進的な取り組みをされています。AI-OCRを初期の頃から使っているのはなぜか生命保険業界が多く、基本的に自社でハンドリングができる業務はデジタル化しています。申込書のような決まったフォーマットのものはほぼデジタル化している一方で、帳票のようなものは自社でハンドリングができません。例えば健康診断の結果は病院によってフォーマットが全く違うので、そこは絶対に残ると考えています。

その非定型のフォーマットをどのように読んでいくかが、次のOCRで求められるマストな要件になってくると考えているので、我々もそこに注力して開発をしています。フォーマットがばらばらの場合、今の仕組みですとお客さまが設定して教え込ませれば動きますが、そこまで教え込ませなくてもデータだけを用意すればお客さまが自分で学習することができ、非定型のAIモデルを簡単につくれるような仕組みを今開発しています。本年度中にリリースすると外部向けに話をしていて、それが次のフェーズです。各社同じような取り組みをしていくでしょうけれども、我々もそこに向けて開発を進めています。

各社の今後の戦略や方向性

藤澤: ありがとうございます。最後の質問になります。2、3年後を見据えた戦略や方向性についてと、これからAI-OCRを使い始めるユーザー企業の皆さまに一言ずつお願いします。小原さんからお願いします。

小原: 長年OCRに取り組んでいますが、引き続き技術投資を続けてOCRの精度だけではなく文書の仕分けやチェックをする、ワークフローを組む等の機能をアップしていきたいと考えています。COEを使うこともいいですが、エンドユーザーの視点でより使いやすいツールがあればと考えて、来年日本で本格的に発売を開始しようとしている製品があります。これはどちらかというとRPAのビジョンに一致しますが、エンドユーザー・コンピューティングやシチズンデベロッパーが使えるようなOCRの製品です。

帳票には非定型や定型等のいろいろなタイプがあり、それらをベンダーやパートナーに設定してもらうのもいいですが、ユーザーサイドで全て行いたい場合もあるので、そのためのプラットフォームを開放するつもりです。ユーザー側でトレーニングしてカスタマイズしたものを、社内だけではなく社外でも使えるようなマーケットプレイスを構える予定で、自由に流通ができるような仕組みづくりをオープンに行おうとしています。

オープンの部分でいうと、先ほどもいろいろとコメントがありましたが、自社だけで全てまかなうのは難しいです。実際に弊社のケースでいうと、違うエンジンをABBYY製品と組み合わせることで、活字でも手書きでもベストなパフォーマンスを提供している事例があります。Cogent Labsさんの「Tegaki」と組み合わせているのですが、AI insideさんのアライアンスもウェルカムです。先ほどの例は少し驚きました。

梅田: 本当ですか。お客さまが独自に行っていることですが、そこはぜひともお願いします。

藤澤: ぜひこの後に。続いて梅田さんからお願いします。

梅田: 直近でいうと、年内をめどに海外展開を予定しています。これは近く発表できる予定ですが、アジアに向けて手書き文字がきちんと読めるものを出していきたいと考えています。次が先ほど言った非定型の領域で、お客さまが自分で非定型のAIのモデルを作れるような、AI inside Learning Centerという製品を本年度中にリリースする予定です。その先にもいくつかあり、紙帳票は明確になくなっていくと考えていますが、文字は紙だけではありません。

我々の事例でいえば、例えば動画からテロップを抽出して英語の字幕スーパーを抜いて、日本語に翻訳変換をして提示するプロジェクトにテレビ朝日さんと一緒に取り組んでいます。ほかに紙ではなく物などから文字データを取ることができないかと考えて今取り組んでいる事例が、日本酒のラベルを読むことです。かなり達筆な文字が書かれていますよね。ああいったフォントなどを、スマートフォンで撮って読めるようにすることも行っています。今も紙以外の展開は行っていますが、もっとライトに使えるようにしていきたいと考えています。

日本で使用されている漢字は、常用漢字を含めると6,000文字ぐらいあります。AIは1個の文字が6,000文字のどこに分類されるかという方法で、文字を識別することができます。カタカナの「ソ」と「ン」はよく似ていますが、それを見分けることができるエンジンなので、画像認識全般においても転用が可能です。例えば車のセダンとSUVを見分けるのと、手書きの「ン」と「ソ」を見分けるなら絶対に後者の方が難しいです。

画像認識のAIも、先ほどの非定型と同じようにお客さまで作ることができます。ABBYYさんと重複してしまいますが、プラットフォームとしてアプリケーションストアを提供し、お客さまが作ったAIをお客さま同士で簡単に使い合えるようにしていきたいと考えていて、そこに向けて今開発をしています。先ほどお話を聞いていて似たようになると感じましたが、それでユーザーが便利になるのであれば、各社こぞって行えばよいのではないでしょうか。

小原: ワインのラベル認識はできますか?

梅田: ワインのラベルは試していませんが、日本酒と比べたら絶対に簡単なのでワインの方が読みやすいのではないでしょうか。

小原: ABBYYのエンジンを使っているアプリケーションで、ワインのラベルを撮るとデータが取れるものがあります。

梅田: 確かにできそうです。

小原: 日本酒はありません。

梅田: 逆に日本酒は難しいです。

小原: ぜひともお願いします。

梅田: あれは手書きで我々が得意としています。

藤澤: かなり特徴的な漢字ですよね。

梅田: 非常に難しい漢字を使っているケースがあります。1文字だけでしたが、その1文字がそもそも学習をさせていない文字でした。これはどうするかという話になりましたが、1文字だけだったのでよかったです。1文字であればなんとかなりますが、100文字くらい増えると一から学習をし直さなければなりません。

横道に逸れますが、昔の戸籍謄本は手書きです。銀行などから毛筆の達筆な文字で書いてある文書を読めるようにしたいというご要望をいただいていて、その辺りも取り組んでいきたいと考えています。文字だけでもいろいろなニーズがあり、そこは挑戦していく必要があるのではないでしょうか。

藤澤: ありがとうございます。続いてアルバートさんからお願いします。

アルバート: AI-OCRの話からすると、現状のエンジンの精度を継続的に向上させ、あらゆる機能を強化していきたいと考えています。また、先ほども少し話をしましたが、次につながるエンジンとして、年内にスマートOCRの正式リリースをしたいと考えています。準定型・非定型構造の膨大なテキストデータの中からインサイトを引っ張り出し、それをさらに次の解析や経営判断につなげられるようなものを皆さんに提供したいです。

藤澤: ありがとうございました。いろいろなお話がありましたが、特に最後は非常にわくわくするお話が多かったです。

何年か前にAI-OCRを使っていてその時は駄目だったとしても、今はもはや違う世界になっている部分もありますし、小原さんや梅原さんがおっしゃっていたように、まずは試しに使ってみることがとても重要です。AI-OCRを使ってみたいと考えていらっしゃる方は、ぜひともこちらの3社に問い合わせをして実際に使ってみるとよいのではないでしょうか。本日は小原さん、梅田さん、アルバートさん、お話しいただきありがとうございました。失礼します。

梅田: ありがとうございました。

小原: ありがとうございました。

アルバート: ありがとうございました。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。