MISC

2012年9月26日

ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価

研究報告ハイパフォーマンスコンピューティング(HPC)
  • 菅原 誠
  • ,
  • 小松 一彦
  • ,
  • 平澤 将一
  • ,
  • 滝沢 寛之
  • ,
  • 小林 広明

2012
10
開始ページ
1
終了ページ
7
記述言語
日本語
掲載種別

本論文では,熱プラズマによるナノ粒子群創製プロセスにおける集団的粒子形成過程をシミュレーションするナノ粒子群形成アプリケーションを OpenACC と OpenCL を用いて実装し,両者を比較検討する. OpenACC は既存のプログラムにディレクティブを追記することにより容易に GPU を利用することが可能である.それに対して, OpenCL はより低い抽象度でのプログラミングが可能である.プログラム可能な抽象度がそれぞれ異なるため,実現可能な最適化技法が異なる.各最適化技法の性能評価により, OpenACC では CPU 実行時の最大約 1.9 倍の性能向上を, OpenCL では最大約 5.6 倍の性能向上を達成できることが分かった.また,現状の OpenACC において達成可能な性能限界と,高い性能を得るためには, OpenCL のような低い抽象度での最適化が必要であることを議論する.This paper presents an implementation of the plasma-assisted nanopowdergrowth simulation with OpenACC. OpenACC provides compiler directives to allow an existing application to use GPUs. On the other hand, OpenCL is a lower-level programming model. Since OpenACC and OpenCL offer programming models of different abstraction levels, they require different optimizations for a given application code. Therefore, in this paper, several versions of a practical application, the nanopowder growth simulation, are implemented using different optimizations. Then, the performance impact of each optimization is discussed through some experimental results. The evaluation results show that OpenACC and OpenCL can achieve 1.9x and 5.6x performance improvements, respectively. It is also demonstrated that the current version of OpenACC requires low-level performance tuning such as OpenCL programming in order to achieve a high performance comparable with OpenCL.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110009453376
CiNii Books
http://ci.nii.ac.jp/ncid/AN10463942
URL
http://id.nii.ac.jp/1001/00083950/
ID情報
  • CiNii Articles ID : 110009453376
  • CiNii Books ID : AN10463942

エクスポート
BibTeX RIS