ディープラーニング、必要な画像データ数と種類の真実：分かったつもり？　AI画像認識

ディープラーニングを画像認識に活用するためには、学習の段階でどのようなステップを踏む必要があるのしょうか。必要な画像データ数や、画像の種類は？　具体例で説明します。

» 2019年04月12日 08時00分公開

[中尾雅俊, 矢嶋博，パナソニックソリューションテクノロジー]

監修：中尾雅俊

パナソニックソリューションテクノロジー AI・アナリティクス部ソリューション推進課主事

2017年にNVIDIAとの協業を担当したことを皮切りに、AI・データ分析中心の業務を推進。初期投資や導入リスクが大きい、「人工知能の現場導入で失敗させない」活動としてセミナー講演など多数実施。受講者からは、「AIがよく理解できた」「そんなノウハウを話しても良いの」と心配されるほど。最近の趣味は実用を兼ねたDIYや果樹菜園など。

監修：矢嶋博

パナソニックソリューションテクノロジー　産業IoTSI部ソリューション推進課係長

製造業向け「AI画像認識ソリューション」のSEとして、営業支援やPoC推進を担当。ソフトウェア開発からITインフラ構築まで、これまでの幅広い経験を生かし、AI画像認識システムの提案から導入、AI学習トレーニングまでを手掛けている。趣味の風景や家族写真撮影に加え、学習用画像収集をライフワークにしている。

　ディープラーニング（深層学習）は、AI画像認識のコア技術の1つです。ディープラーニングによって、AIによる画像認識の精度が飛躍的に高まったといえるでしょう。ただし、ディープラーニングに対しては、正しい認識があまり広がっておらず、過度の期待がある一方で、過小評価する論調も聞かれています。こうした傾向は、優れた技術の健全な普及と活用を阻害するもので、あまりよいこととはいえません。大切なのは、ディープラーニングで「できること」「できないこと」を正しく理解した上で、この技術を業務の生産性向上や変革にどう役立てるべきかを考えることです。

　そこで本連載では、3回に分けて、ディープラーニングの「真実」をありのままにお伝えしています。明らかにしているディープラーニングの真実は下記の3点です。


	3つの真実
真実その1	課題によっては、ディープラーニングを使わないほうがよい領域がある
真実その2	ディープラーニングの頭脳を育てるには相当の労力がいる
真実その3	画像認識だけでは、製造ラインの完全自動化は難しい

　前回は、ディープラーニングの基礎的な理解を深めていただくとともに、「課題によっては、ディープラーニングを使わないほうがよい領域がある」という真実について解説しました。今回は、「ディープラーニングの頭脳を育てるには相当の労力がいる」ついて解説します。

真実その2 ディープラーニングの頭脳を育てるには相当の労力がいる

　ディープラーニングによる画像認識の精度を上げる、つまりは「頭脳を育てる」ためには、適切な数と品質を持った画像サンプルを準備して、ラベル付け（画像内のどこに何があるかを人が指定する作業）を行う必要があります。1つの対象物を認識するために、ときには1000枚以上の画像が必要になることがあります。

　図1は、教師データ（画像）を生成するための一連の作業イメージを示したものです。

図1　教師データ（画像）生成のための作業イメージ

　この図に示す通り、まずは認識対象物をさまざまな条件のもとで撮影します。そして、それぞれの画像の中で、「これが対象物です」というラベル付けを行い、最終的に該当部分のイメージを切り出した対象物だけが映った画像ファイルを作ります。これが教師データの元になります。

　こうした一連の作業は、専用の画像編集ソフトを使うことで効率的に行うことが可能です。ただし、教師データとなる「適切な画像サンプル」を収集すること、そして、その画像に「認識率が高くなるようにラベル付けする」のは容易なことではなく、それには相応の労力がかかることを認識しておく必要があります。

　ところで、「適切な画像サンプル」の「適切さ」の条件とは、一体何なのでしょうか──。それを一口に言えば、「ディープラーニングの仕組みに認識される画像として、将来インプットされる可能性のある画像全て」ということになります。より具体的には、例えば、以下のような条件が相当します。

撮影の方向、大きさ
撮影時の輝度、光の当たり具合（影の条件）
画像のぼやけ具合
過学習とならないための対象物以外の条件のバラつき
予測時の画像条件（他との重なりなど）

　これらの各項目について、マトリックス的に条件を考えていくと、その数は無限大に膨れ上がってしまい、画像サンプルを準備することは不可能です。そのため、現実的には、優先度の高い条件の画像から準備し、運用する中で徐々に不足する条件の画像を増やして、頭脳を賢くするのですが、とはいえ、最初の段階でどのような条件の画像サンプルを用意するかは重要なポイントとなります。

　例えば、認識したい対象物が犬であるとしましょう。この場合、1つの教師データは、「シェパード犬」が「座って」「水を飲んでいる」ところを、「左上から光が当たっている状態」で、「右方向から」撮影した画像といったかたちになります。

　また、これらの条件が、さまざまな組み合わせのもとで発生する可能があるので、理想的には、条件による画像サンプル数の“偏り”を抑えながら、1対象物あたり数百～数千枚のサンプル画像を準備することになります。

　その逆に、AI画像認識を使ったシステムの運用時に、AIが認識（推論）すべき画像として発生する可能性のないものについては、教師データとして与えないほうが賢明です。

　こうした教師データを準備する上で求められるスキルの一つは、無限に考えられる条件の中から、AIの“頭脳”を育成するために必要な画像を絞り込み、画像点数を可能な限り減らすことです。

　また、ここで詳しくは述べませんが、「どのようにラベル付けするか」によっても、認識率は大きく変わります。対象物が複数重なって存在した場合、一部分しか見えていない場合、ぼけた画像などに対して、どのようにラベル付けするかも、ディープラーニングを上手に使いこなすための技術なのです。

　このスキルを獲得することで、効果的な画像認識を他社に先駆けて実現し、自らの力で維持することが可能になるのです。

　このように、AI画像認識を使ったシステムの運用時に、どのような条件の認識が必要になるかは、現場のことを熟知している担当者が最も的確に想定できるはずです。言い換えれば、AIの頭脳を育てるのに最もふさわしい人材は、現場の担当者というわけです。

　もちろん、現場の担当者の方は、AIに関する知識を持っていないのが通常です。そうした方に、いきなり「AIの“育て親”」の役割を演じさせるのは現実的ではないと思われるかもしれません。ただし、この問題の解決方法は既に存在するのです（その方法については、次回以降で紹介します）。

　現在、サービス業界などにおいては、「顧客の情報を大量に収集して、適切に分析した者が市場を制する」といわれています。製造業界におけるAI画像認識についても、これと同様のことが言えます。すなわち、人が目視で行っていた作業を、少しでもAIに任せられる「頭脳」の作り方をいち早く習得した企業が、競争優位を確立できるというわけです。

　そのために何よりも必要とされるのは、現場で認識すべき画像の特性を理解し、どうすれば教師データの収集・撮影が効率的に行えるかを考えられる担当者が現場にいることです。そうした担当者の力を、AI画像認識の発育にうまく活用できれば、現場の競争力は確実に向上します。また、画像認識について現場でのアイデアを即座に試したり、環境の変化や認識不良といった事象に対してすぐに対処したりすることも可能になるはずです。

　次回は「真実その3 画像認識だけでは、製造ラインの完全自動化は難しい」について紹介します。

企業紹介：パナソニックソリューションテクノロジー

パナソニックソリューションテクノロジーは本格的なICT時代の幕開け前から30年にわたり、IT基盤の設計・構築、ソフトウェア、SIサービスでお客さまの業務課題解決に努めてきました。さらにICTシステムの設計・構築を起点に、Al・データ分析、IoT、働き方改革、そしてBPOまで分野を広げています。製造業や建設・物流・金融・エネルギー・自治体など、さまざまな業界・業務の知見を基としたソリューションで、お客さまの仕事の仕方・プロセスを加速度的に変え、成長につなげていきます。

アイティメディアからのお知らせ

キャリア採用の応募を受け付けています

SpecialPR

ITmediaはアイティメディア株式会社の登録商標です。

ディープラーニング、必要な画像データ数と種類の真実：分かったつもり？ AI画像認識

監修：中尾雅俊

監修：矢嶋 博

真実その2 ディープラーニングの頭脳を育てるには相当の労力がいる

企業紹介：パナソニック ソリューションテクノロジー

関連リンク

アイティメディアからのお知らせ

ディープラーニング、必要な画像データ数と種類の真実：分かったつもり？　AI画像認識

監修：矢嶋博

企業紹介：パナソニックソリューションテクノロジー