講演・口頭発表等

国際会議
2017年9月

GPUメモリを超える大規模計算の実現に向けたステンシル計算のためのフレームワークの開発

2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017)
  • 下川辺 隆史
  • ,
  • 遠藤 敏夫
  • ,
  • 小野寺 直幸
  • ,
  • 青木 尊之

記述言語
英語
会議種別

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80\%程度の実効性能を達成した。