研究分野の概要
最先端の計算科学を推進するためには、常に超高速・大容量計算が要求されます。その要望に応えるため、様々なハードウエアおよびソフトウエアの研究開発を行っています。センター内の応用系の研究部門との連携により、実問題に対する理想的な高性能計算システムの提供を目指しています。
研究紹介
①分野の説明
高性能計算システム研究部門では、最先端の計算科学の推進のために求められる超高速・大容量計算の要望に応えるため、様々な高性能計算(HPC)向けハードウエアおよびソフトウエアの研究開発を行っています。センター内の各応用分野チームとの連携により、実問題に対する理想的なHPCシステムの提供を目指しています。
研究対象は、高性能計算アーキテクチャ、並列プログラミング言語、大規模並列向け数値計算アルゴリズムおよびライブラリ、GPUなどの演算加速システム、大規模分散ストレージシステム、グリッド/クラウド環境など、多岐に渡ります。
②研究トピックと成果
PEARL:高性能・低電力・高信頼相互結合網
PEARはPCI-Express gen.2技術に基づく相互結合網リンクで、低電力組み込みシステムから高性能クラスタまでのシステムに対応します。我々はPEARLを実現するため、PEACHと呼ばれるカスタムチップを開発・実装しました。単なる相互結合網としてだけでなく、GPUなどの周辺デバイスまでも直接結合することを可能としています。
図1 PEARL実験ボード(左)と通信性能(右)
XcalableMP:次世代大規模並列向けプログラミング言語
数十万台の分散メモリノードを持つような次世代並列システムにおいては、従来の明示的なメッセージパッシング型プログラミングではソフトウエアの生産性を高めることが困難です。簡単な並列プログラミングを実現しつつ性能チューニングの自由度を高めるために、我々はXcalableMPと名付けた新言語を開発しています。これはベースとなるCまたはFORTRAN言語に、OpenMPライクな指示文を追加することにより、分散配列の処理を簡潔に記述します。それと共に、高度なチューニングを許容するPGAS的なローカルビューモデルを提供します。
Gfarm:大規模広域分散ファイルシステム
現実的な大規模広域分散計算環境において、高性能分散ファイルシステムは極めて重要な技術です。Gfarmは我々の部門で開発されているオープンソースな分散ファイルシステムであり、数百台規模の分散ノード、数百Tbyteのストレージ、毎秒数千のファイル処理を実現します。メタデータサーバーが性能ボトルネックとならず、クライアント数における高い拡張性を保つように設計されています。
高性能・大規模並列数値アルゴリズム
FFT-Eは我々の部門で開発されているオープンソースな高性能並列FFTライブラリで、自動チューニング機構を持ち、PCクラスタから超並列システムまで幅広く対応します。Block Krylov部分空間反復法を用いたBlock BiCGGR法に関する研究では、複数解を持つ線形方程式において、計算精度を保ちつつ反復回数を削減することを可能にしました。本手法は素粒子研究部門において実用されています。
図2 T2K-Tsukubaにおける3次元FFTの結果(左)とBlock Krylov部分空間法によるヤコビ法による前処理における収束性(右)
関連リンク:ハイパフォーマンス・コンピューティング・システム研究室
研究部門主任
朴 泰祐(筑波大学大学院システム情報系教授/計算科学研究センター副センター長)
HPCシステム研究者として、計算科学研究センターが所有してきたCP-PACS、FIRST、PACS-CSなどほぼすべてのスーパーコンピュータの開発に携わりました。センターの各応用分野の研究者との緊密な議論と共同研究に基づいて、これらのシステムを実現してきました。主な研究分野は高性能相互結合網、大規模クラスタ設計、並列プログラミング、実アプリケーション性能チューニング、GPUコンピューティングです。
メンバー
教授 高橋 大介
教授 建部 修見
講師 川島 英之
助教 多田野 寛人
研究員 田中 昌宏
研究員 松本 和也
学内共同研究員/教授 安永 守利
学内共同研究員/教授 和田 耕一
学内共同研究員/教授 櫻井 鉄也
学内共同研究員/准教授 山口 佳樹
学内共同研究員/助教 今倉 暁