Yahoo! JAPANは2015年5月に自社開発の音声認識エンジン「YJVOICE(ワイジェイボイス)」へサービスとしてディープラーニングを初めて実装し、以降、ニュースなどコンテンツ配信の個別最適化(パーソナライズ)の精度向上のためにも活用してきた。
例えばパーソナライズされたニュースコンテンツに画像を自動的に付加する仕組みなどに利用する画像認識技術、ニュースのレコメンデーションなどにもディープラーニングが使われている。しかしkukai以前のディープラーニング環境はシングルGPUで構成したもの。それでは今後のサービス実装、研究や調査のためには力不足なことが明らかだった。
kukaiの誕生で、従来の225倍という処理能力が手に入った同社は、その性能をベースに、新機能や機能改善、新サービスなどの検証フェーズにもディープラーニングを活用していくという。
「Yahoo! JAPANはサービス規模が大きく、対象とするモデルのサイズも巨大。その独自性を生かしてディープラーニングを推進していくきっかけがkukaiによって生まれました。今後はユーザーサービスはもちろんのこと、スマホアプリなどの展開にもディープラーニングを応用していきたい。当面はこのシステムを安定稼働させて、実績を作ることに注力していきます」(角田氏)
データの量という面でいえば、製造業をはじめ、恐らくYahoo! JAPANの持つデータ量に匹敵するような規模のデータを持つ国内企業は相当数ありそうだ。「超巨大コンピュータリソース」と「グローバルなITサービス」で突き進むGoogleやFacebookなどの超巨大企業に大きく水をあけられた感のあるAI分野だが、低コストなスパコンをプラットフォームにし、目標を絞り込んだ日本独自のAI進化の可能性もあるだろう。
スパコンの性能をベンチマークする著名なプロジェクトに「TOP500」があり、世界のスパコンの性能をランキングして、1位から500位までのリストを年2回発表している。こちらが単純に処理性能をベンチマークするのに対して、GREEN500は、TOP500リスト内のスパコンを対象に、電力当たり(1ワット当たり)の性能(フロップス単位)で算出し、電力効率の良い順に1位から500位までを、やはり年2回発表している。
「kukai」との関連は?
低コストで高速なディープラーニングを目指して開発されたkukaiは、まず2017年6月発表のGREEN500での上位ランクインを念頭にしてチューニングされた。Yahoo! JAPANとして今回が初めての挑戦だったが、わずかの差で2位という好成績を残した。製品を提供したエクサスケーラーはGREEN 500の常連でもある。
GPUベンダーのNVIDIAの最新GPU。数値演算を並列して高速に行える演算アクセラレータとして、HPC用途に多用されている。特に膨大な計算量となるディープラーニングへの適性がよい。その性能の理論値は、倍精度浮動小数点演算性能で4.04テラフロップス(GPU Boost時 4.67テラフロップス)、単精度浮動小数点演算性能で8.07テラフロップス(GPU Boost時 9.34テラフロップス、半精度浮動小数点演算性能で16.14テラフロップス(GPU Boost時 18.68テラフロップス)だ。
「kukai」との関連は?
演算アクセラレータとしてNVIDIA Tesla P100を160基搭載している。2017年6月発表のGREEN 500上位ランクのスパコンは、ほとんどがこれを採用していた。
ディープラーニング用のフレームワーク。どちらもオープンソース製品。TensorFlowはGoogleが開発したもので、同社の各種サービスに活用されている。Caffeはカリフォルニア大学バークレー校のYangqing Jiaがプロジェクトを立ち上げ、Berkeley AI Research(BAIR)で開発された。
「kukai」との関連は?
GPUを利用したディープラーニングに適した機能を備えており、これらオープンソースフレームワークの利用を前提にシステムが設計された。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。