2020年6月22日、日本のスーパーコンピュータである「富岳(ふがく)」が性能で世界No.1の座についた。これは2011年の「京(けい)」以来の快挙。今回は「富岳」の実像を紹介する。
「富岳」は理化学研究所と富士通の共同開発によるスーパーコンピュータ(以下、スパコンと表記)だ。理化学研究所と富士通は、2011年に「京」で性能世界一を獲得(2期連続)でマークして以来、国産スパコンがしばらく遠ざかっていた性能世界一の座に返り咲くことになった。しかも1つの性能指標ではなく、4つの異なるベンチマークで世界トップの成績を示しており、「世界4冠」を達成したことになる。
かつて「京」の戴冠で一躍有名になったのが、スパコンの性能ベンチマークによる世界ランキングである「TOP500」だ。今回の「富岳」の場合も、TOP500ランキングリストの最上位に名前が記されたことを指して「性能世界一」といわれている。
TOP500は、1993年から年2回(6月と11月)公開され、高性能計算の性能基準として活用されてきた。その評価方法は、行列やベクトル演算に重要な浮動小数点演算の性能を測定するLINPACKベンチマークを利用したもの。同ベンチマークは測定に長時間かかることから信頼性の指標ともなる一面もあり、コンピュータ技術開発の到達点を測る1つの重要な指標となってきた。表1に2020年6月発表のTOP500リスト上位3機種の概要を示す(左から順に1位、2位、3位)。
TFLOPS、PFLOPS、EFLOPS:FLOPSはFloating-point Operations Per Secondの略で、浮動小数点計算が秒あたり何回できるかの性能指標となる単位。T(テラ)は10の12乗、P(ペタ)は10の15乗、E(エクサ)は10の18乗を示す。
しかし、LINPACKベンチマークベンチマークは必ずしも産業利用など現実的な性能指標とならない場合があると指摘されるようになってきたことで、別のベンチマーク方法が追加されてきている。現在では、従来のTOP500ベンチマークと新しく追加されたベンチマークを含め、総称として「TOP500」と呼ぶこともある。
従来のLINPACKベンチマーク以外の指標として2014年6月から公開されるようになったのが、自動車や飛行機などの空力設計や構造計算など各種産業利用アプリケーションでよく使われる共役勾配法 (conjugate gradient method)という計算手法を用いる「HPCG(High Performance Conjugate Gradient solver)」(表1中に記載あり)だ。「京」も2014年11月から4期連続世界2位、2016年11月から3期連続世界1位となったことがあるが、「富岳」も今回、同ベンチマークで首位となった。
また近年ではビッグデータを対象にした分析や、機械学習・AIアプリケーションなどにも高い性能のスパコンが望まれており、新たなベンチマークとして「Graph500」と「HPL-AI」が登場している。
Graph500は、超大規模グラフの探索能力を評価するもので、例えば交通ネットワークやソーシャルネットワーク、サイバーセキュリティ、バイオインフォマティクス、脳科学などのように、数十〜数百億を超えるような大規模データの探索や最適化、クラスタリングなどを必要とする分野で重要な性能指標となる。2010年11月からランキング形式で発表されており、「京」は2014年6月および2015年7月から9期連続の世界1位を記録している。「京」の運用終了に伴い、2019年11月に中国の「神威・太湖之光」に1位の座を明け渡したが、今回の「富岳」で大差をつけてトップの座を取り戻した。しかもこの成果は「富岳」全体の6割ほどのノードを稼働させることによって達成されたという。
そして今回新しく発表されたHPL-AIは、ディプラーニングなどAI処理に着目したベンチマークだ。従来のHPL(High-Performance LINPACK)ベンチマークは倍精度演算を前提にしていたため、現在のAI処理に多用されているGPUやAI専用チップによる低精度演算の大規模並列処理の性能を反映できなかった。HPL-AIでは、低精度演算能力も評価することにより、AI処理性能を間接的に測るものになっている。「富岳」は初のHPL-AIでもダントツでトップの座を獲得した。
つまり「富岳」は、TOP500、HPCG、Graph500、HPL-AIの4つのベンチマークで世界一の性能を実現した。しかもその4冠は、2位以下に数倍の差をつけての成果だ(表2参照)。
「富岳」は2020年5月に搬入を完了、すでに一部は新型コロナウイルス対策のために試行的利用が始まっており、2021年から共用運用が本格的に開始される予定だ。現在の性能はまだ調整中の段階で、ベンチマークテスト時の性能は100パーセントではなく、さらに性能を上げられる余地が十分にあるという。
GTEPS:TEPS(Traversed Edges Per Second)は 1秒間にたどるグラフのエッジ数のことで、グラフ探索性能の指標となる単位。G(ギガ)は10の9乗を表す接頭辞。
またこれら4つのベンチマークの他に、現在各国が競って上位ランクを目指しているのが「Green500」だ。こちらはTOP500ランキングの各ベンチマーク値を消費電力で割り、電力効率を競うプロジェクトである。プロセッサの性能限界は並列化を進めていくことで超えられるが、プロセッサが増えるほど消費電力は増えていくため、使用できる電力の限界が性能を決めるようになってきている。これからはますます、消費電力あたりの処理効率が優れたコンピュータが有利になる。
こちらの最新ランキング(2020年6月)では日本のPreferred Networks製の「MN-3」がトップに輝いており、「富岳」は9位だ。電力効率(GFLOPS/Watts)は「MN-3」が約21.1、「富岳」が約14.7となっているが、後述するように「富岳」はArmベースの汎用(はんよう)CPUを採用し、他の多くのGreen500リスト中の機種のようにGPUや特殊なCPUを使っていない。汎用CPUだけを使いながら他の多くのGPU利用機種などの電力性能をしのいでいるのは驚くべきことだ。
このような成果を上げながらも、開発を担ったメンバーは「ランキングを意識して開発したのではなく、高いアプリケーション性能、低消費電力、汎用性、使いやすさを追求した結果が評価された」と口をそろえる。特に「京」と異なるのは、多様なアプリケーションの処理性能と汎用性を強く意識したことだ。
かつて民主党政権時代にスパコン開発競争に対して「2位じゃだめなんですか」という質問が浴びせられたことがあったが、それには巨額な開発コストが社会への利益としてどう還元されるのかが見えにくいことが背景にあった。現在のスパコンには、単なる技術力の誇示でなく、実社会への貢献が求められており、「富岳」はこの点にも配慮して開発された。
その特徴の大きな1つは、Armベースの新CPUである「A64FX」を、理化学研究所・富士通・Armと協業で開発したこと。48コアを集積したこのCPUは、インテルの最新汎用CPUの3倍の性能を持っている。またスマホなどのアプリケーションも稼働可能な汎用性がある。OSはRed Hat Enterprise Linuxが採用され、一般に普及している開発言語をそのまま利用可能となっており、新規のソフトウェア開発においてもコストや時間が節約できる可能性が高い。SPARCベースのCPUを利用していた「京」は、シミュレーションなどの科学技術計算には大きな貢献をしてきたが、産業利用の幅は大きく広がらなかった。その弱点を「富岳」は埋めることができそうだ。
表3に「京」と「富岳」の仕様や性能(理論最高値)の比較を示す。「富岳」の性能数値の( )内は、CPUクロック(通常モード2GHz)を2.2GHzにしたブーストモードでの数値である。「富岳」は48コアCPUからなる15万8976ノード(763万848コア)を432のラックに収め、富士通独自の高速ネットワーク「TofuインターコネクトD」で接続する。ブーストモードでは単精度演算の場合で1070PFLOPSと「京」の100倍を超える性能が実現する。1ノードあたりの性能も表3に見る通り、大きく向上している。
なお、AI学習に使われる半精度演算は2.15EFLOPS、AI推論に使われる整数演算性能4.30EOPS(いずれもブーストモード)となっており、これらは「京」とは比較にならない性能である。また総メモリ容量は4.85 PiB、総メモリバンド幅は163 PB/s(「京」の約29倍)となっている。
「富岳」の一部はすでに試行的利用されており、新型コロナウイルスの影響解明、感染拡大シミュレーションなどに利用されている。今後は次のような社会課題の解決にも生かされていく予定だ。
こうした成果を期待して、政府は「スーパーコンピュータ『富岳』成果創出加速プログラム」をスタートした。果たして世界4冠のスパコンは、2021年以降、基礎研究や応用研究、ビジネス、そして社会と生活にどのような恩恵をもたらすのだろうか。期待して見守りたい。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。