メディア

3分で知る、ディープラーニングで「できること」「できないこと」分かったつもり? AI画像認識

従来の機械学習に比べて、圧倒的な精度を誇る深層学習。しかし、なぜそれが可能なのでしょうか。その仕組みを知ると、深層学習の「できること」「できないこと」が見えてきます。

» 2019年03月15日 10時00分 公開
[中尾雅俊, 矢嶋 博パナソニック ソリューションテクノロジー]

監修:中尾雅俊

パナソニック ソリューションテクノロジー AI・アナリティクス部ソリューション推進課 主事

2017年にNVIDIAとの協業を担当したことを皮切りに、AI・データ分析中心の業務を推進。初期投資や導入リスクが大きい、「人工知能の現場導入で失敗させない」活動としてセミナー講演など多数実施。受講者からは、「AIがよく理解できた」「そんなノウハウを話しても良いの」と心配されるほど。最近の趣味は実用を兼ねたDIYや果樹菜園など。

監修:矢嶋 博

パナソニック ソリューションテクノロジー 産業IoTSI部ソリューション推進課 係長

製造業向け「AI画像認識ソリューション」のSEとして、営業支援やPoC推進を担当。ソフトウェア開発からITインフラ構築まで、これまでの幅広い経験を生かし、AI画像認識システムの提案から導入、AI学習トレーニングまでを手掛けている。趣味の風景や家族写真撮影に加え、学習用画像収集をライフワークにしている。

 本連載では、AIやAI画像認識に対する過剰な期待やよくある誤解を「5つのミスジャッジ」として整理してご紹介してきました。では、そうしたミスジャッジを防いだとして、AI画像認識を現場に導入することで、どんなメリット、そしてデメリットを生むのでしょうか。次のテーマとして、AI画像認識の「真実」に迫ります。

 画像認識などの分野で、ときに人を超える認識精度を誇るディープラーニングですが、その仕組みから得意でない分野もあります。今回は、分かっているようで知らない、ディープラーニングの仕組みとその特徴を分かりやすく解説します。

ディープラーニングで「できること」「できないこと」

 AI画像認識のコア技術の1つにディープラーニング(深層学習)があります。ディープラーニングは、収集したデータから特徴を学習する工程を何層にもわたって繰り返すことで、高い認識精度を実現する技術です。画像認識・音声認識の領域では、すでに人を超える認識精度を実現しているケースも報告されています。

 これまでの画像認識では、画像に含まれる特徴的な部分を人間が判断し、人間が書いたアルゴリズムに沿って分類していく手法が一般的でした。例えば、「猫」を認識する場合、「とがった耳」「アーモンド型の目」「丸くなった背中」といった要素に対してアルゴリズムを設計し、記述していました。

 ただ、猫の耳はネズミにかじられて欠けているかもしれませんし、夜には目が丸型かもしれません。驚いて背筋がピンと伸び切った猫もいるでしょう。そうしたさまざまな要素を人が全て判断してアルゴリズムを設計することには限界があったのです。

 それに対して、ディープラーニングによる画像認識では、物体を認識するための要素(特徴点という)を、収集したデータに共通している特徴から自動で導き出します。そして、導いた特徴のそれぞれに対して、画像の中の猫を猫として判断する起因度合いに応じた重み付けの値を設定します。

ディープラーニングによる画像認識 ディープラーニングによる画像認識

 例えば、猫を判断する場合の特徴が、耳・目・体形の3つとしたときに、耳の特徴を55%、目を25%、体形を20%といったかたちで重み付けをして評価するイメージです。

 この例の場合、体形がそっくりな場合より、耳の特徴が似ている方が、猫と判断される可能性が高いことになります(耳のほうが判断材料として重みが大きいため)。

 では、この重み付けの値は、どのように決められるのでしょうか──。

 ディープラーニングでは、「たまたま教師データとして与えられた画像」の一部を評価用として取り出し、残りを学習用として頭脳を作ります。そして、事前に取り出した評価用の画像を使って、その生成した頭脳が、どの程度正しく認識できるかを評価します。その後、膨大に存在する変数の組み合わせ(どれを特徴点に選ぶか、その重みはどうするか、など)による頭脳を仮に作って実際に認識評価を行い、一番正しく評価できた組み合わせを頭脳として採用します。※1

 ここで着目していただきたいのは、ディープラーニングのAIでは、猫の画像を猫と判断する場合に、「なぜそれを猫と判断するか」の理屈を積み上げていくのではなく、単純に「一番正しく判断できた条件がそれだったから」という従来とは異なる方法で頭脳が作られていくことです。

 そのため、ある認識に対してAIが出した結論が、人の結論とは異なるものであっても、人には、「なぜそのようにAIが判定したか」が分からない状態に陥ります。本連載の第1回で、鉛筆を認識させる際にいつも白い紙の上に置いた画像で学習をさせると、「背景が白」という鉛筆には関係のない要素まで、鉛筆の特徴としてしまうと述べましたが、この時のように、たまたま与えた教師データに偏りがあったことが原因かもしれませんし、それ以外に原因があるかもしれません。いずれにしても、AIが導いた結果に対して、因果関係を知ることが難しいという特徴があります。

 ともあれ、ディープラーニングは、各層にデータを入力して結果出力を繰り返すことで、局所的な特徴から抽象的な概念まで判断することができる頭脳を形成します。これは、人のニューラルネットワーク(神経回路網)に似ています。また、ディープラーニングは、教師データと呼ばれる学習用のデータを使って頭脳の学習が進行していきますが、偏ったデータばかりで学習させていると、少し困った結果を引き起こすリスクがあるのも、人との共通点といえるかもしれません。

 このように、ディープラーニングが人の「脳」と似た仕組みを持つことは、ときにはメリットになり、デメリットにもなります。特に、工場の製造ラインなどのビジネスの現場に適用する場合は、特徴点が明確な特化用途を目的とすることがあるので、ディープラーニングによる判断ではなく、むしろ従来のアルゴリズムにより判断をする仕組みのほうが望ましいケースもあるでしょう。このようなディープラーニングが持つ特徴を踏まえながら、適材適所で活用していくことが求められます。

 以上の内容を踏まえながら、ディープラーニングに関する以下の「3つの真実」について明らかにし、製造現場でのディープラーニング活用の可能性を探っていきましょう。

         3つの真実
真実その1 課題によっては、ディープラーニングを使わないほうがよい領域がある
真実その2 ディープラーニングの頭脳を育てるには相当の労力がいる
真実その3 画像認識だけでは、製造ラインの完全自動化は難しい

 次回はこれら3つの真実の中から、最初の真実「課題によっては、ディープラーニングを使わないほうがよい領域がある」という点について詳しく説明します。

※1: ディープラーニングでは、対象物の特徴点、重み付け、評価データの選び方など、さまざまな条件で認識評価を繰り返し実行し、最も認識率が高い組み合わせを見つけます。そのため、頭脳づくり(機械学習)には、高性能なコンピュータが必要となります。

企業紹介:パナソニック ソリューションテクノロジー

パナソニック ソリューションテクノロジーは本格的なICT時代の幕開け前から30年にわたり、IT基盤の設計・構築、ソフトウェア、SIサービスでお客さまの業務課題解決に努めてきました。さらにICTシステムの設計・構築を起点に、Al・データ分析、IoT、働き方改革、そしてBPOまで分野を広げています。製造業や建設・物流・金融・エネルギー・自治体など、さまざまな業界・業務の知見を基としたソリューションで、お客さまの仕事の仕方・プロセスを加速度的に変え、成長につなげていきます。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。