研究ブログ

河野太郎の質問に答える

 とりあえずざっと下書き。だんだん手直ししていくつもり。元の質問はこちら。>http://www.taro.org/2011/11/post-1118.php

1. スパコン京の利用については、選定機関が認めたものに限るようだが、既に科研費の審査を通ったものについて、再度、スパコンを利用するための申請書を書き、それを審査するのは無駄ではないか。負担金額に応じたリソースが使えるようなルールにすべきではないか。(科学振興予算の純粋科学と技術開発の割り振りを適正化する必要がある)
ワシ意見:科研費の審査は研究の内容を見るものである。対して、京のようなスパコンを利用する必要がある研究かどうかのチェックはコンピューターの専門家の知見が必要であり、研究内容の判断とは全く別物である。

2. 成果目標の明確化を求めると、純粋な研究の可能性を狭めないか。
ワシ意見:成果目標が明確でない研究に、多額の税金を投じて作られたマシンのリソースの使用が適切とは思えない。

3. 来年6月の引き渡しから半年近く経った11月からしか供用されないのはなぜか。
ワシ意見:普通のPCクラスタでも、規模が大きくなるとチェック項目が増える。ことに、ネットワーク網が複雑なマシンの配線のチェックは時間がかかる。京のように膨大なCPUを搭載し、密結合したマシンは、なおさら動作チェックに時間がかかる。

4. 京を中核とするネットワークで接続されたHPCIとこれまでのネットワークに接続されているスパコンの環境はどこがちがうのか。
ワシ意見:HPCIを知らないので回答不能。

5. 「次世代スパコンと全国の主要スパコンをネットワークで結ぶことにより、研究の内容、性質に応じて最適なスパコンを選んで計算することが可能になる」というが、計算機を使い分けることが実際にあるのか。
ワシ意見:パソコンレベルでも、キャッシュサイズやGPU有り無しで計算スピードや適切なライブラリは異なる。複数のアーキテクチャで性能効率を比較検討することはベンチマークテストの常識。

6. ソフトウェアのデバッグを考えると、京一台というのは効率が悪くないか。
ワシ意見:京の利用形態は不明なれど、CPUを多数搭載しているので、1Nodeごとにユーザを割り当てて同時並行的にプログラム開発してもらうことは可能なはずである。全部のCPUをつぎ込む計算でない限り、京1台でも開発環境としては充分と言える。

7. 東大の次世代スパコンは、富士通の1ペタ以上のものになるが、これまでの日立のスパコンからのソフトウェアの移行という作業が加わることをどう考えるか。
ワシ意見:東大の人に聞いてほしいが、コンピューターのアーキテクチャ、ことに世界の頂上を目指すスパコンのトレンドはベクトル型CPUからコモディティCPU(アーキテクチャ)を多数利用したものに変化した。その辺かに対応することはごく当たり前のことで、逆に、トレンドに乗らない旧アーキテクチャにしがみついたソフトウェア開発を続ける方がおかしい。

8. また、京大の次世代はCLAYになるが、同じような問題が発生するのだろうか。
ワシ意見:同上。そもそもそれは「問題」ではない。

9. 民間で京クラスのスパコンを必要とするところがあるか。ソフトウェアをかける研究者がいるのか。これまでのスパコンの民間の利用はどうだったのか。
ワシ意見:詳細は知らないが、製薬開発、自動車開発での利用例があると聞いたことがある。ゼロではないはず。また産学連携的な研究もあるんじゃないかと思われる。

10. 本当に「スパコンを利用した研究が飛躍的に進展し、推定利用者が1000人から2万人になる」か。
ワシ意見:誰がそんなことを公言したかは知らないが、そんなわけないだろうと言いたくなる。

11. 開発加速の経費110億円が削減されたのにほぼ当初のスケジュールできているのはなぜか。企業努力なのか。
ワシ意見:富士通の驚異的な粘りがあった、ということは伝え聞いた。

12. NECや日立に支払われた開発経費はどうするのか。
ワシ意見:NECと日立に聞いてほしい。

13. メンテナンス経費は適正か。
ワシ意見:金額を知らないので回答不能。

14. ストレージの単価の低減が急激に起こることを考えると、ストレージの導入計画は適正か。
ワシ意見:どういう接続形態かは知らないが、安くなったストレージが、現在の京に接続できるものなのかは予測不可能では?

15. スパコンの利用率は導入年度には低く、後年度に高くなることを考えると、性能はレベルアップ方式で調達すべきではないのか。
ワシ意見:性能差のあるCPUを少しずつ継ぎ足していったスパコンの利用効率をあげることは難しい。そういう研究を推進すべきという意見は分かるし、かつてもそういう環境でのアルゴリズム研究を見たことはあるが、あまりうまくいってないように見受けられる。レベルアップは少なくとも数年単位、グロスで行うべき。

16. 10ペタという開発目標は適正だったのか。
ワシ意見:結果として達成できたのだから適正といえる。Top500の性能予測でも裏付けられている。

17. 10ペタフロップスの性能に対して、1ペタバイトのメモリーは適正か。
ワシ意見:適正かどうかは利用者が判断すべき。

18. 文科省は、かつてLinpackで一位になった中国のスパコン「天河」に関して、「多くのアプリケーションで必要とされる主記憶との間のデータ転送性能が十分とは言えず、応用範囲は限定的。性能を引き出すためには専用の言語でのプログラミングが必要となるため、ソフトウェア試算の継承や流通が難しい」と指摘したが、なぜ、京では10ペタフロップスだけが強調されるのか。
ワシ意見:その指摘自体が既に時代遅れになっている。10 PFlopsだけを強調しているという指摘自体が理解できない。

19. スカラー型とベクター型の混合型が適正とした当初の計画から、スカラー型のみの計画に転換したのはなぜか。
ワシ意見:時代の流れ。コストや今後の技術トレンドを考えると、頑張ってベクトル型を維持するメリットが開発途中で失われたと自分は解釈している。関係者の口が重いので、詳細は不明なれど、政治的・経済的な駆け引きがあってのドタバタ劇だったのだろうと考えている。

20. 文科省は、自民党の事業仕分け、民主党政権の事業仕分けで指摘されたことに対して、きっちりと答えていないではないか。
ワシ意見:文科省にこの「トレンドの変化」を説明できる人材がいないのでは。情報処理学会HPC研究会・ARC研究会あたりに参加している重鎮の研究者に直接聞いた方が早い(もっとも意見は結構まちまちのような・・・)。

21. 一部の学者のためのスパコンになっていないか。
ワシ意見:スパコンを使いこなす研究や人材が育っていない、という理屈は昔からあった。今もたぶんその状況は変わっていない。すべての研究者がスパコンを必要しているわけでもないので、裾野を広げる必要があるのは認めるが、「一部」は結構多数になると認識している。

22. なぜ、スパコン京の利用を一部の機関、一部のプログラムに優先的に割り当てる必要があるのか。
ワシ意見:「一部の機関」を知らないので想像で答えると、「過去の実績」や「利用ニーズ」に応じて京のリソースを割り当てることはごく当然のことと考える。

23. 今後のスパコン開発は何を目標とするのか。なんのためのスパコン開発をするのか。
ワシ意見:上記の意見と重複するところもあるがかいつまんで整理すると
 ・アプリケーション(ソフト)が主、スパコン(ハード)は従、とすべき。
 ・アプリが受け持つ社会的要求に対応するためにスパコンを開発する。
となる。

---
(参考)河野太郎のまとめ と 牧野先生の解答(上記と比較すると面白い)