検索
特集

用語解説:ディープラーニング(Deep Learning、深層学習)困ったときのビジネス用語(2/3 ページ)

AIを活用したビジネス開発が活発だ。なかでもディープラーニングは注目を集めているが、その理由は? 私たちの業務はどう変わる? どこで使える? 基礎知識から技術応用のアイデアまでを解説する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

ディープラーニングの仕組み

 機械が人間のように物事を認識して、何らかの問題に対する答えを出力する仕組みは、1960年代に「ニューラルネット」として既に実現した。これは脳の神経回路の構造を模倣したもので、中核となるニューロンに当たる「ノード」と、情報の入出力を担う樹状突起や軸索に当たる「エッジ」で構成される。

 その構造を多階層で組み合わせると、図2の模式図のようになる。図の○記号がノード、線がエッジを表す。図を見ると分かる通り、ディープラーニングでは、入力を受け取るノードと出力するノードの間に複数の「隠れ層」を持ち、隠れ層のそれぞれのノードが情報を処理して(重み付け判定をして)次の隠れ層に結果を渡す。この「隠れ層」が複数あり、複雑な複数の概念を抽象化できるのがディープラーニングの特長といえる。

 例えば猫の画像を認識する場合なら、画素の状態の入力から、隠れ層1では被写体のエッジを認識、隠れ層2では目鼻などのパーツを認識、隠れ層3では顔として認識するというように、右の層に行くほど抽象度が高い高度な概念として認識されていく。

 最後の出力層のノードの1つは、猫に反応する(=猫だと認識する)ノードになる。画像を入力するたびにノードとエッジに付与される重み付けが変わり、ノードの接続関係などがだんだん変わり、認識の精度とスピードが上がっていく。このような、多層ニューラルネットワークを用いた学習が深層学習=ディープラーニングである。

多層ニューラルネットワークのイメージ(実際には6層以上の層にすることが多い)
図2 多層ニューラルネットワークのイメージ(実際には6層以上の層にすることが多い)

 ディープラーニングには多大な計算機資源と時間が必要だ。しかし、いったん学習が済んでモデルができてしまえば、後の推論などの処理は簡単なシステムで高速に実行できる。それをデバイスに組み込めば、目的に特化した各種の自動認識・判断機能を持つ製品が出来上がる。Webからのサービス提供も簡単だ。

 そうしたアプリケーションの可能性は無限にあり、ビジネスも生活も、社会そのものさえ変革していくだけのポテンシャルがあると考えられている。

 ただし、人間の脳の神経細胞は1兆数千億個といわれているのに対し、計算機資源は極めて小さな規模であることも事実。人間の知的活動の一部を担うことができるにすぎないことも理解しておいた方がいいだろう。

機械学習とディープラーニングは違うもの? 同じもの?

 従来の一般的な機械学習は、データから特徴やルールなどを抽出して論理(アルゴリズム)を作成、新たなデータに対して演繹(えんえき)的に論理を発展させて結論を出すような手法をとる。

 しかし、特徴やルールを抽出し、有用な知識表現を行うには、対象領域への深い知識・ノウハウを持つ専門家(人間)の介入が必要だった。前提に間違いがあったり、論理に破綻があったりすると結論を誤るからだ。その代わり、推論の過程は全て説明可能だ。

 ディープラーニングは、データそのものに内在している特徴やルールを、大量データの中から「自分であぶり出す」ことができるため、一般的な機械学習が演繹的手法とすれば、こちらは帰納的な手法といえる。その過程は外から見えず、説明ができない。それでも、この手法が一般的な機械学習よりもはるかに優れた結果をもたらすことが実証されたことで、学習の主流がこちらに切り替わった。ポイントは次の3点だ。

  • 専門家が不要であり、大量のデータがあれば目的に沿ったシステムが作れる
  • 手法そのものに一般性があり、同一技術/ツールで多領域の知識の学習が行える
  • 画像、音声、テキスト、センサーデータなどのマルチモーダルデータに対応する

 一方、課題は学習に計算機資源が豊富に必要なところ。実はディープラーニングの自動認識精度向上には、データに意図的なノイズを加えたり、機能を制限したりといった冗長性を加える操作が寄与している。そうすることで、多様な状況の中でも「共通する確かな特徴(頑健性のある特徴)」を抽出できるのだ。

 そのため、学習データはさらに増えることになり、できるだけ高性能かつ低消費電力の計算機資源が大量に必要になる。これに関しては比較的低コストなクラウドの利用やAI専用ハードウェア、あるいは国が計画している共同利用の「AI特化型クラウドサービスインフラ」などの選択肢がある。また、学習済みのモデルを特定の業界や業務に特化して構築し、サービスとして提供するベンダーも出現している。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る