論文

2014年2月

GPU向けQCDライブラリQUDAのTCAアーキテクチャによる実装

情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
  • 藤井, 久史
  • ,
  • 塙, 敏博
  • ,
  • 児玉, 祐悦
  • ,
  • 朴, 泰祐
  • ,
  • 佐藤, 三久
  • ,
  • 藏増, 嘉伸
  • ,
  • Mike, Clark

2014
35
開始ページ
1
終了ページ
7
記述言語
日本語
掲載種別
研究論文(学術雑誌)
出版者・発行元
一般社団法人情報処理学会

近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信を CPU メモリを介して行う必要があるため,複数回のメモリコピーが発生してしまう.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.そこで,筑波大学計算科学研究センターでは,GPU 間通信のレイテンシの改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.2013 年 10 月には TCA 実証システムである,HA-PACS/TCA クラスタが導入された.本稿では,素粒子物理学のための GPU 向け格子量子色力学 (格子 QCD) ライブラリである,"QUDA" に対し,TCA を適用した実装について述べる.

エクスポート
BibTeX RIS