2021年9月13日、RPA BANK はキーマンズネットに移管いたしました。
移管に関する FAQ やお問い合わせは RPA BANKをご利用いただいていた方へのお知らせ をご覧ください。
RPA BANKが2018年6月、RPA BANK会員向けに実施した「RPA利用実態アンケート調査レポート」(有効回答数:720社)によると、RPAを導入している企業のうち15%は、AI-OCRやAIチャットボットなどの形でAI(人工知能)を用いている。RPA未導入/トライアルフェーズの企業においても「自社にAIを導入済み」との回答が6%あり、生産性向上に向けてのAI活用と、RPAとAIを併用するアプローチの広がりが明らかになった。
しかし、AI-OCRの導入については「大量に蓄積する紙の問題に対する課題意識はあるものの、活用に踏み切れていない」といった声も依然根強く聞こえてくる。
そうしたなか、テクノロジーを貪欲に取り込もうとしている企業がある。世界有数のたばこメーカー、JT(日本たばこ産業株式会社、東京都港区)だ。
手書き文字からの入力作業を自動化する目標に向けて、同社がいち早く本格導入の準備を進めるAI-OCRの採用経緯と、実用化に向けた戦略を担当者らに聞いた。
ー新しく登場したAI- OCR(光学文字認識)を用いた日本語手書き文字の認識に、今回JTが着目した経緯について聞かせてください。
加藤治氏(経営企画部次長): 当社の主力商品であるたばこは嗜好品であり、マーケティング戦略においては喫煙者の生の声を集めることが極めて重要です。デジタル化の時代とはいえ、アンケートの媒体として「紙による手書き」は捨てきれず、また新たな施策の参考として、数十年前に遡って書庫の資料にあたることも珍しくありません。
私は昨年10月に社内業務のデジタル化推進担当として着任し、さっそくテクノロジーによる業務改革のアイデアを社内に募ったところ、やはり「手書き文書のデータ化」への要望が多く寄せられました。さらに近年、AI(人工知能)の活用でOCRの精度が向上しているとの情報もあったため、主要なAI-OCRを一通り検討することにしました。
―テスト導入に選んだAI-OCRは、株式会社Cogent Labs(コージェントラボ)の「Tegaki」でした。何が決め手となったのでしょうか。
加藤: 各ベンダーに「実際にテストしたい」と問い合わせたところ「すぐ試せる環境があるのでやってみてください」と、真っ先に快諾してくれたのがコージェントラボでした。技術に対する圧倒的な自信がうかがえたこと、また初期費用なくリーズナブルな従量課金制での運用が可能なTegakiであれば確実に導入効果が見込めることから、テスト導入を即決しました。
現在はマーケティングのほか、PCがすぐに使える環境にない製造現場など10以上の部署から導入希望があり、順次対応を進めているところです。
山形典孝氏(IT部主任): Tegakiが操作性に優れていたこと、またコージェントラボの技術的な対応が早かったのも大きいと思います。
私は、経営企画が立てたデジタル化のプランを技術面からサポートする役目で、もともとはサーバー関連のエンジニアです。そのため、クラウドサービスであるTegakiが扱えるか、という不安もありましたが、1時間ほどで覚えられる簡単な操作でしたので何ら問題はありませんでした。
その一方、実は当社ではTegakiを標準仕様のままでは導入できないという問題にもぶつかりました。というのも、文字認識した後のスキャン画像データをAI-OCRのさらなる学習に使うという標準設計が、情報管理に関する社内規定に抵触したからです。ですが、同社にこの点を相談したところ、文字認識後のスキャンデータを削除する機能がすぐ搭載され、無事にテストを進めることができました。
―手書き文字の認識率に関して、実地で試してみた結果はどうでしたか。
加藤: AI-OCRの精度にはもちろん期待していましたが、読み取る対象が変わる以上、公称値はあくまでも目安だと考えていました。実地のデータでは、崩し書きされた「了」の字を「ろ」と読むようなやむを得ないミスも少なくないため、アンケートを対象にテストした際の認識率は80%といったところです。これは帳票によって異なりますが、アンケートの認識率についてはこの水準で満足しています。
―実地での精度が分かったところで、もう少し性能向上を待ちたいと思いませんでしたか。
加藤: 認識率にとらわれすぎると100%近くなるまで動くことができず、結局活用のチャンスを逃してしまいかねません。OCRに限らず、新たなデジタル技術の応用に関しては、良さそうな技術であればすぐに活用し、ある程度のところで「見切る」決断が不可欠だと思います。今回も様子見は考えませんでしたし、むしろ「いますぐ手に入る技術で、どれだけ多くのことを簡単・便利にできるか」というメリットに注目していました。
山形: 多少誤認識が混ざっていたとしても、読み取り結果に対応するスキャン画像の箇所を示す機能がTegakiに搭載されているため、両者を対照すれば解読にはさほど苦労しません。「全体の8割が正しく読めれば十分」という用途は、当社以外でも確実にあると思います。
―文書全体としては8割方の認識率でよいとしても、いくつか「絶対間違えられない要素」が混じっているものではないでしょうか。
加藤: はい。この点を懸念する声が社内でも多く聞かれます。ただ、少しやり方を工夫し、上手に割り切ればクリアできるので、その都度説明して理解を求めているところです。
一例として、手書き文書の文字認識で間違えられない典型が「記入者の氏名」です。最も書き慣れているぶん、崩し字になる可能性が高いこともOCRにとって不利に働きます。しかし、従業員向けの文書であれば「社員番号」の数字を1字ずつ独立した枠内に記入させ、後からデータ照合する方法を採れば、ほぼパーフェクトの精度を達成できます。
同様に、重要な回答項目では自由記入の様式をやめ、選択肢にチェックを入れる方法に切り替えることで認識率100%に近づけることが可能です。
―個人情報が含まれた文書を、クラウドを介して適正にデータ化するための対応も必要となりそうです。
山形: そうですね。ここまでのテストでは個人情報が記載された文書を扱っていませんが、今後活用を進める中では配慮が必要となります。具体的に考えられる方法は
- 文書中の個人情報を含む箇所を、そもそもスキャン対象から外す
- スキャン画像から個人情報を削除して送信する
- 個人情報のスキャン結果を項目単位に分解し、ランダムに送った結果から復元する
の3通りで、状況に応じて適切な方法を選ぶことになると思います。
変化の激しい時代に重要なのは「スピーディーで柔軟な対応力」
―お二人とも「開拓者精神」とも言える非常に意欲的なチャレンジをなさっていますが、日ごろから何か心がけていることがあるのでしょうか。
加藤: 私はこれまで工場経験が長いこともあり、「現場がきちんと回ってなんぼ」という気持ちが強いです。
デジタル化にしても、テクノロジーの導入自体が目的ではなく、現場の仕事を簡単・便利にするための手段に過ぎません。ですから、有効に使えるかどうかをまず探り、手続き上求められる形式や数字は、後でそろえていけばよいと考えています。
山形:個人的には、これからのIT部門には、いま現場が何を求めているかをつかむ感度と、具現化するための試行錯誤が欠かせないと考えていました。「変化の激しい時代に対応するには、仕様を柔軟に変更できることが重要」と日々感じています。
TegakiはAPI(アプリケーション・プログラミング・インターフェース)が公開されていて、自社のシステムとの連携を自由に試せる点に大きな可能性を感じます。Webベースのユーザーインターフェースが非常に洗練されているのも魅力的で、基幹システムの経験が長いエンジニアにとっては「スマホアプリ並みの高い利便性を、業務の中でどう実現するか」を考えるためのお手本として、学ぶところが大いにあると思います。
―最後に、Tegakiの本格運用に向けた今後の見通しについて聞かせてください。
加藤: Tegakiの使用料は、数万円程度の基本料金の範囲内で、20行の記述を月間1,500件程度は読み取れるので、当面は十分すぎるほどです。ですから導入効果の見通しを詳しく計算するまでもなく、手を上げてくれた部署にはまず使ってもらい、その中でも特に現場の意欲が高いところを優先させる形で導入規模を拡大していきたいと考えています。順調にいけば、さほど遠くないうちに最初の具体的な成果が発表できるでしょう。
Tegakiの機能向上のスピードは目覚ましく、社内向けの説明資料のアップデートが追いつかないのはうれしい悩みです(笑)。いまの仕様を前提に足下の実用化に取り組みつつ、開発陣へのフィードバックも続けていき、さらなる進化に期待したいと思います。
―具体的な導入効果をお聞きできるのが楽しみです。本日はありがとうございました。
Copyright © ITmedia, Inc. All Rights Reserved.