2010年10月25日

Tianhe、NebulaeのUpgrade情報とTSUBAME2.0

 2010年10月18-19日、ハワイのマウイで、International Exascale Software Project(IESP)の第5回目のMeetingが行われた。IESPは2009年から、一連のMeetingを Santa-Fe、Paris、Tsukuba、Oxfordで行ってきており、今回が第5回目という事になる。Exec. CommitteeにはJack Donngarraほか米欧日の大型スパコン保有組織からの10名ほどのメンツが顔を並べている。
 国際政治でのG8とか、金融財政のG7とかと同様、Top500での力関係から言うと、中国が抜けていることになり、今回、中国科学院のXue-Bin Chiが中国のスパコンの状況を ”The Developoment of HPC in China” としてBriefingし、そのPresentation DocがUpされていた。

 このDocの中で、NebulaeとTianheの状況が以下のように簡単に触れられている。

Dawning Nebulae
 - 600TFLOPS CPU + 3PFLOPS GPU
 - Top500 Rank 2nd
 - Budget 600M RMB
    * MOST 200M, Shenzhen Government 400M
 - Upgrade 1PFLOPS CPU,  200TFLOPS Godson
 
NUDT Tianhe
 - 200Tflops CPU + 1.2PFLOPS GPU
 - Top500 Rank 7th
 - Budget 600M RMB
    * MOST 200M, Tianjin Government 400M
 - Upgrade 1PFLOPS CPU + 4PFLOPS GPU
    * HPL 2PFOPS 
 
 この記述とMeeting 出席者からのTwitter情報により、TianheがUpgradeされ、HPLで2PFLOPSを達成したということになっているようである。確かに、Nebulaeに関してはUpgradeの記述はあるが、HPL等の具体的データは記述されていないのに対し、Tianheには具体的数値が示されており、それがもし目標値であれば出席者が耳で聞いていてその旨注意を喚起するであろうから、この数値は実行結果ということなのであろう。

 数値の精度に関しては、記述全体が、1桁、良くて2桁程度なので、大枠についてであろうと思うが、TianheがLinpack 2Pflopsを達成し、11月のTop500で、第1位になる可能性が高いということのように思える。 
 米国のメディアにおいても、Top500のデータ集積の親方衆の1人であるJack Dongarra氏も中国1位予想説を否定していないといった記事を読んだ記憶があるので、結構信憑性が高いのではないかと思う。
 となると、NCSAのBlueWatersがどうなっているのかは知りたいところであるが、厳しいかん口令を敷いているのか、あるいは、ほんとに出すデータがないのかは、ここ半月ほどで明らかになる。

 Upgraded Tianheの実行性能比は大雑把に、2Pflops/5Pflops=40%ということになるが、プレゼンの中ではUpgradeの内容に関して、何も触れていないので、詳細はわからない。
 GPUが従来のRadeon HD4870x2なのか、Tesla C2050に取替えたのかは不明であるし、CPUも従来のXeon E5540+E5450のままなのか、NebulaeのようにX5670等に変更したのかも不明である。 あるいはBoardメーカに関しても、NebulaeはDawning TC3600であるが、以前からTianheに関しては記述はなく、今回も情報は見当たらない。

 TianheのBoard構成に関しては、2009年11月のTop500サイトの中の記事に、E5540の計算ノードは2CPU 2GPUでメモリは32GBとなっていたので、GPU当りのメモリ量は余り潤沢とは思えない。NebulaeのTC3600に関しては2CPU 1GPUということらしいが、メモリサイズは不明である。

 こうしたメモリ量は実行性能に大きな影響を与えるものと考えられ、実行性能比が低い理由の一つとも考えられるが、如何せん、Original及びUpgradeの詳細内容が明らかでないので、余り有意味な議論は出来ないであろう。

(注1) 


<調達費用比較>
 
 上述の中国科学院のプレゼンで、筆者の興味を引いたのは、筆者の思考傾向からは当然であるが、調達費用の話である。Tianhe、Nebulae共に、600M元(RMB)となっており、 その内の200M元を国の科学技術省(MOST)が負担し、その倍の400M元をそれぞれ深センあるいは天津の地方政府が負担していることである。

 中国の税制の詳しいことは知らないので、これらのスパコンの地方負担ということのお金の流れ的な意味はピンと来ないが、日本は勿論、米国でも、多分欧州でも、基礎科学技術的なものは国の組織下で国の負担が一般的なような気がするので、受益者負担的に2/3 を地方政府に負担させるという方式は、西欧型社会では、所有権、管理権、使用権とかが絡んで結構めんどくさい事になるかも知れない気がした。

 さて、価格に関しては、プレゼンのデータはUpgrade前の調達費用と考えられるのだが、現在の為替レート、1元=12.2196円、1元=$0.150、を適用すると、600M元は約73.3億円、$90Mということになる。理論性能とLinpack実行性能およびLinpack実行性能のTflops単価は以下のようになる。

Tianhe-I <1206Tflops, 563Tflops、1302万円>
Nebulae <2984Tflops、1271Tflops、577万円>
TSUBAME2<2400Tflops、1200Tflops??、222万円??> (??は予想値)

 大雑把に言って、TianheもNebulaeも、GPUタイプのスパコンとしては、CPU鎮一タイプに比べコスト・アドヴァンテージがある様には見えない。どちらかと言うと、設置面積や電力消費のアドヴァンテージの方が大きいように見受けられる。残念ながら、UpgradeしたTianhe,Nebulaeに関してはデータがないので判断しようがない。
 これに対し、TSUBAME2.0はLinpackで概ね1.2Pflops以上が達成できれば、GPUタイプとしての設置面積、消費電力に加えコスト・アドヴァンテージもあるので、国際基準でいっても、結構良い線をいっているように思える。

 TSUBAME2.0が我々に投げかけている本質的問題は、我が日本国の、スパコンに対する基本戦略の問題であり、今時、たかが1台のスパコンのために1200億円もかかけることに何の意味があるのかという事なのであり、その他多くの国立研究機関でのコストに杜撰なスパコン調達に対する厳しい検証の必要性を訴えているのである。

 




***(注1)***

 注1の部分にあった、以下の記述は仕様の誤解釈でしたので削除しました。

< 因みにTSUBAME2.0はノード当り2CPU 3GPUであるが、メモリは52+96GBでGPU当り48GBのようなので、この辺りはTSUBAME1.2からの経験ではないかと思うが、1ノード3GPUのため苦労しているらしい事が見てとれる。>

 TSUBAME2.0のHPのHWの記述(http://tsubame.gsic.titech.ac.jp/hardware-architecture)を見ると、「54GB(一部96GB)」となっており、削除記述は5月頃の若干曖昧な記述を(贔屓目に)拡大解釈したための誤解釈でした。
 一部の96GBのノードを除いて、1GPUあたりのメモリは54/3で18BGと思えます。  (2010/11/02)



Posted by petaflops at 23:03│Comments(0)TrackBack(0) スパコン 04 

この記事へのトラックバックURL

http://trackback.blogsys.jp/livedoor/petaflops/51476576

コメントする

このブログにコメントするにはログインが必要です。