2013年7月
TCAアーキテクチャによる並列GPUアプリケーションの性能評価
情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
- ,
- ,
- ,
- ,
- 巻
- 2013
- 号
- 37
- 開始ページ
- 1
- 終了ページ
- 6
- 記述言語
- 日本語
- 掲載種別
- 研究論文(学術雑誌)
- 出版者・発行元
- 一般社団法人情報処理学会
近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信では CPU メモリを介して行う必要があるため,複数回のメモリコピーを行う.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.そこで,筑波大学計算科学研究センターでは,ノード間通信および GPU 間通信のレイテンシとバンド幅の改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.本稿では,TCA を用いた並列 GPU アプリケーションの性能評価について述べる.