メディア

第一生命の書類判定AIは「不確かさ」も自覚、手続きの40%を自動化へ700種7万枚の書類、手書き難読症例を読み解く

難読文字やくずし文字、非定型文書を扱うAIには読み取り精度だけではなく「不確かさ」への自覚も重要だ。第一生命が導入するAI-OCR基盤は不確かさを判定して精度を高めるアプローチを取る。

» 2020年06月29日 13時00分 公開
[キーマンズネット]

 第一生命保険(以下、第一生命)は保有契約の手続処理(保全)について、ITを活用した大幅な業務効率化を図る。支援したシナモンとPFU、富士ゼロックス、富士通の4社が2020年6月25日に発表した。

手書き診断書の文字の例(出典:シナモン)

 第一生命は、これまでもRPA(Robotic Process Automation )やチャットbotなどを導入して業務の自動化を進めてきたという。それでも、契約内容の変更や保険金や給付金の支払いといった事務処理では書類を目視して確認していた。特に保険金請求では医師の診断書のように、難読かつくずし文字を含む手書き書類、非定型の書類も含まれる。間違いなく手続きを進めるには目視の作業が必要だったという。

 こうした目視の作業が必要な書類の数は、1日当たり平均7万枚にものぼる。請求書などの定型の帳票は分かりやすいが、非定形の書類もあり、自動化が難しいとされる領域だ。

 そこで、第一生命はさらなる自動化を目指して目視作業にAI-OCRを採用した。今回のAI-OCR導入のポイントは、ポイントソリューションとしての導入ではなく、汎用的に利用できるように「AI-OCR基盤」を構築する点だ。

AI-OCR基盤導入の効果(出典:シナモン)

約700種類の書類を自動読み取り、「ちょっと不安」もAIが自己申告

 今回導入するAI-OCR基盤は、手書きを含め、文字や帳票の「種類」を認識する。請求書のような定型の帳票だけでなく、保険請求に必要な診断書や本人確認のための健康保険証といった非定型のものも含め、約700種類の帳票を自動的に読み取れるという。具体的には下図に示すように、イメージの取り込みから帳票の認識、文字の認識などのステップで複数のAI-OCRや最適化エンジンを組合わせて処理を進め、最終的には各種データ連携システムにも接続する。

 正確さが求められる保険請求処理の自動化ではAI(人工知能)の自動読み取りに間違いは許されない。そこで、第一生命のAI-OCR基盤では帳票や文字読み取りAIの「精度」だけでなく、どのくらい「AIの判定が確かではないか」を正しく判断することも重視された。

 AIには、ベンダーが実施する基本的な学習に加えて、20万件以上の診断書や請求書の手書き文字などを第一生命が独自に学習させた。これには難易度の高い手術名なども含まれる。今回の基盤導入を発表したシナモンら4社は、この学習によって読取精度が9割を超えるとしている。

 AI-OCR基盤を活用した実際の事務処理では、個別の読み取った情報に対して、基盤のAIが「正解確率」(確信度)を算出する。確信度が高ければそのまま自動的に処理するが、確信度が低ければオペレーターに確認・補正するよう促す仕組みだ。読み取り制度についてもスコアリングをして目視すべき情報がどれかもAIが示唆する。

AI-OCR基盤の概要と各処理で使われる製品、ソリューションなど(出典:シナモン)

 パターン数が非常に多い病院発行の領収書や診療明細書などについても今後学習を進め、導入範囲を拡大する予定だ。第一生命では年間約300万件にのぼる目視での書類点検や記載内容の入力業務などについて、約40%の効率化を目指すとしている。

 なお、今回の導入に当たって、各社の役割は以下の通り。

 シナモンと富士ゼロックスは、それぞれOCR(Optical Character Recognition:光学的文字認識)エンジンを提供、PFUも同社のOCRエンジンを提供するとともに、帳票の読み取りや帳票の仕分け、各OCRエンジンへの振り分け、OCRエンジンの確信度に応じた処理制御といった、業務全体を制御するプラットフォームを提供した。

 富士通は、システム全体の設計を担当した。製品導入から稼働までのサポートや、複数のベンダーでの開発作業に対する横方向の支援、ベンダー間の調整など、プロジェクト全体をコントロールした。

各社の担当と提供ソリューション

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。