2010年11月15日

スパコンTop500 2010-11、国別シェアなど

 2010年11月14日、アメリカのNew Orleansで行われているSC10で2010年11月のSupercomputer Top500が発表された。

<2010-11 SC10 Top10>

順位       Site & System                 Linpack    理論性能  効率    消費電力  
                                  TF       TF            MW
1 <Tianhe-1A> 中国 NUDT in Tianjin            2566.0     4701.0  54.6%    4.04
    X5670 2.93Ghz NVIDIA C2050           
2 <Jaguar> 米 ORNL、                             1759.0    2331.0  75.5%    6.95
     Cray XT5-HE Opteron 6-core 2.6G             
3 <Nabulae> 中国 Shenzhen SC、                 1271.0    2984.3  42.6%    2.55
    Dawning TC3600, X5650, NVIDIA C2050             
4 <Tsubame2.0> 日本 東工大                 1192.0    2287.6  52.1%   1.34
       HP SL390s X5670, Nvidia C2050
5 <Hopper> 米 LBNL/NERSC                       1054.0    1288.6  81.8%    2.93
       Cray XE6 opteron 12core 2.1 GHz      
6 Energy and Atomic Commission(CEA)  仏     1050.0     1254.6  83.7%   
      Bull S6010/S6030、Xeon    
7 <Roadrunner>  米 LANL                           1042.0    1375.8  75.7%    
       IBM QS22/LS21, PowerXCell 8i           
8 <Kraken>  米 U‐Tennessee                       831.7    1028.9  80.8%    
        Cray XT5-HE Opteron 6-core 2.6 GHz   
9 Forschungszentrum Juelich (FZJ) 独        825.5    1002.7  82.3%    
        IBM Blue Gene/P 
10<Cielo> 米 LANL/SNL                       816.6    1028.7  79.4%    
 
       Cray XE6 Opteron 8core 2.4 GHz

 今回の話題はnVIDIA-Tesla(C/M2050) GPGPUの台頭で、第1位のNUDT(国立防衛技術大学)のTianhe-1A、第3位の深センSCのNabulae、第4位の東工大Tsubame2.0など、Top5の3システムがnVIDIA-Teslaを使ったCPU+GPGPUタイプのスパコンであったことである。そして、3システムとも東アジアに設置されたもので、世界のスパコン勢力図の重心がほんの少しだけ東アジアに移ったことを示している。

 ただし、これら台頭の基本的テクノロジーは米国製であり、また、来年になると、今回は間に合わなかった、NCSAのBlue Waters(10Pflops Power7)やLLNLのSequoia(20Pflops Blue Gene/Q)、さらには、NASA AMESのPleiadis、ORNLのGPGPUを使ったJaguar後継機といったといった10~20Pflopsクラスの機械が目白押しなので、半年か一年でゆり戻しが起きる可能性は高い。

新規Top10入りは
第1位の中国のNUDTのTianhe-1A
第4位の東工大TSUBAME2.0
第5位の米LBNL/NERSC(バークレイ研のNERSC)のHopperでCray-XE6
第6位のフランスCEA-DAM(代替エネルギー・原子エネルギー委員会軍事応用部門)のBull社製Tera100
第10位のLANL/SNLのCray-XE6 Cielo
である。

 順位的には 7位までがPeta越えで、10位でも0.8PFlopsである。参考までに第500位は31.12Tflopsである.

 その他、気がついたことを以下に列挙する。

・Cray-XE6で第5位のLBNL/NERSCのHopperなどにはOpteronの12coreが使用されている。

・第114位にBG/Q Prototypeが載っており(実行65.35T,理論104.86T)、1680Mflops/Wというブッチギリの電力効率とのこと。たしかに、この値そのものはブッチギリでtsubameや苦節ウン年のgrapeなどの約2倍であるが、昨年2月頃の担当者のインタビュー記事では3000Mflops/wを目指しているとか言ってた記憶があるので、目標に比べると、まだ半分という事で、今後どうなるのか注目したい。

・Blue Waters Power7に関してはPrototypeもどきも見当たらず、ほんとに何も出すものがなかったようである。

・CPU+GPGPU方式の評価に関してはHPCCのデータをチェックする必要がある。

・Tsubame2の実行効率52.1%はTianhe-1Aの54.6%に肉薄しており、ノード3GPUでノード1GPUと大して変わらない性能を示したことは、価格面、電力消費、設置面積などでノード3GPUの方が遥かに有利なので、Tsubame方式が広まる可能性は高い。

・第170位に理研に納入された「京」のPrototypeがリストされており、実行48Tflops、理論52.2Tflopsとなっている。highlightのところにK-ComputerはBG/Qに次いで829Mflops/Wと書かれているので、CPUタイプのシステムとして京はかなりいい電力効率を示していると考えられる。ビジネスチャンスを失わないためには、BG/QとGPGPUとの間に挟まれての、迅速なコストを含む思い切ったアクションが必要であろう。

・ベンダ別シェアでは、IBMが200システムで40%、HPが158システムで31.6%、Cray5.4%、SGI4.4%、Dell4.0%

・PerformanceシェアではIBMが27.4%、Crayが19.1%、HPが15.6%




<2010-11 SC10   国別>

 
  国   Linpack  Share %  理論性能      台数  Share % 
           TF                       TF 
   
1 米   22309.9  51.1%   31500.9       275  55.00%   
2 中    5688.8  13.0%   11609.7           41    8.20%   
3 日    2903.7    6.7%    4605.2           26    5.20%   
4 仏    2874.9   6.6%    3639.7           26    5.20%   
5 独    2721.4   6.2%    3504.9           26    5.20%   
6 英    1519.6   3.5%    2200.0           24    4.80%   
7 韓     907.6   2.1%     1065.5             3    0.60%   
8 露     867.7   2.0%    1143.8           11    2.20%   
9 サウジ   437.4   1.0%    514.3             6    1.20%   
10 カナダ  422.4   1.0%    629.7              6    1.20%    
 Totals 43656.7          64613.7        500     

 演算性能ベースでは、米中日仏独英韓の順で、大まかに言うと、中国は米国の1/4程度、日本は米国の1/8、中国の1/2程度で、日仏独は団子状態、英国は団子の半分くらいといったところ。
 日中ともnVidiaの新規ペタコンの貢献度が高く、日本では東工大のTsubame2.0だけで、6月度の総和に近い数値が加算されており、その他、ヴェクタ機離れで国際基準に近くなりつつある調達コストの効果も出始めているようで、6月度比で約230%の増加である。
 ただし、既にdismountされたはずのTsubame1.2がカウントされていたりして、Top500の精度に関しては若干の疑問符が付く。
 第7位の韓国は韓国気象庁が導入したCray-XE6 2セット(実行合計約633Tflops)の効果である。

 台数ベースでは、米(282=>275)中(24=>41)日(18=>26)独(24=>26)仏(27=>26)英(38=>24)の順である。日本はやっと台数下落の傾向に歯止めが掛かってきたような気配であり、ヴェクタ機の呪縛から逃れる事で、現状の予算のままでも、調達コストを見直すだけで、かなりの改善が図られるものと思う。

 日本は国家のスパコン予算規模的には、演算性能ベースにしろ、台数ベースにしろ、当然、米国に次ぐポジションを占めるべき国であり、徐々にではあるが、回復軌道に戻りつつあることは御同慶の至りである。

 中国の台数分布は100位以内に5件、100位以下に36件がランクインしている。100位以内では3件が国のスパコンセンター、2件が科学院に属するもの。製造は、1位のTianheはNUDTとなっており、第3位のNabulaeと35位の上海SCはDawning、28位の科学院のMole8.5はIPE+nVIDIA+Tyan(台湾?)、68位の科学院の他の1件はLenovoとなっている。
 100位以下の36件は殆どがエンジニアリング会社、テレコム会社、ネットワーク会社、サービスプロバイダ、インターネットなどとなっており、大学は2件である。製造会社はIBMが30件で、次いでHPが5件、残りの1件がInspurとなっている。
 100位以内の大型と100位以下との区別が余りにもはっきりしているので、驚いているし、またIBMが中国でこれほど強いというのも驚きである。
 
 

<2010-11 SC10 日本のTop500ランクイン・システム>

Top
500
順位   Site&System                   Linpack 理論性能
                                   TF    TF
  
4 東工大Tsubame2.0 HP SL390s X5670, Nvidia   1192.0  2287.6    
    NEC/HP     
33 原子力研 BX900 X5570 2.93G                      191.4  200.1    
    Fujitsu     
42 東大物性研 SGI ICE 8400EX                        161.8  180.0    
    SGI     
54 海洋研機構 SX-9/E/1280M160                     122.4  131.1    
    NEC     
59 JAXA Fujitsu FX1, SPARC64 VII                  110.6  121.3    
    Fujitsu     
70 東大 情技センタ Hitachi opteron QC 2.3G       101.7  139.0     
     Hitachi     
74 理研 Xeon X5570 2.93GHz                           97.9  106.0    
     Fujitsu     
88 東工大Tsubame1.2 Sun Fire x4600/x6250        87.0  163.2    
     NEC/Sun     
95 筑波大 計科センタ Appro Xtreme-X3                77.3   95.4    
     Appro International     
103 環境研 Asterism ID318, Xeon+NVIDIA            74.8  177.1    
      NSSOL / SGI Japan     
131 核融合研(NIFS) Hitachi SR16000 Power6         56.7  77.0     
       Hitachi     
134 Service Provider xSeries x3650M2, Xeon        55.9  105.6    
      IBM     
138 東大 ゲノムセンタ SunBlade x6250, Xeon          54.2  69.1    
      Oracle     
153 気象研 (MRI) Hitachi SR16000 Power6           51.2  72.8    
      Hitachi     
158 京大 センター Fujitsu HX600 Opteron               50.5  61.2    
      Fujitsu     
170 理研 先進計算科学研 「京」, SPARC64VIIIfx         48.0  52.2    
      Fujitsu     
219 電力中研 SGI ICE 8200EX, Xeon                     42.7  45.9    
     SGI     
220 物質材料研機構(NIMS) SGI ICE 8200EX, Xeon    42.7  45.9    
      SGI     
279 国立天文台 GRAPE-DR accelerator                   38.9  81.9    
      Self-made     
282 Financial Institution xSeries x3650M2 Xeon     38.8  75.3    
      IBM     
310 Automotive Company DL4x170h Xeon E5550    37.4  48.9    
      Hewlett-Packard     
377 東大 バイオ・医療 PRIMERGY BX922 S2,              34.7  37.8    
      Fujitsu     
378 Service Provider xSeries x3650M2, Xeon          34.7  65.4    
      IBM     
379 Service Provider xSeries x3650M2, Xeon          34.7  65.4    
      IBM     
383 国立天文台 GRAPE-DR accelerator                    34.6  66.4    
     Self-made     
494 統計研 PRIMERGY RX200S5                             31.2  33.8    
     Fujitsu     
     

  
Posted by petaflops at 16:01Comments(0)TrackBack(0) Top500 Report 

2010年11月05日

アゴラの記事「中国スパコンが世界一」に関して

 11月2日付けのアゴラに、山田肇さんという人の「中国スパコンが世界一」という記事が載っている。
http://agora-web.jp/archives/1118551.html

 内容を纏めると、中国のスパコンが世界一の性能を達成したことに関連して、11月1日の日経夕刊で(わが国の次世代機開発は)『国の威信をかけた事業です』と解説している記事や、10月30日の産経のNYTimes等米有力紙を引用した記事などは

・ 「これらの報道は感情に走っている。スパコンの性能が示すものについて基本的な誤解があるようだ」

と断定し、Top500のLinpackによる順位付けに対し

・ 「LINPACKは1970年代に開発されすでに時代遅れなのだが、物差しが代わると経年的な比較ができなくなるので、利用され続けているだけのものである。」

・ 「自動車レースのフォーミュラ1は直線路の最高速度だけで性能が評価できるだろうか。」

と、否定的意見を述べ、結論的に、

・ 「コンピュータ市場の中でスパコンの占める割合は小さい」から
・ 「世界一になったとしても市場への影響は限定的」で
・ 「市場の主戦場はクラウドコンピューティングである。この市場で日本企業に存在感がないことのほうが競争力としてはよほど大問題である。」

とし、

・ 「スパコンは科学技術の一分野に過ぎず、しかも(Linpackは)一側面での評価に過ぎないのだから、大騒ぎに意味は無い」

といったような主張である。
  
  
 始まりのNYTなどからの状況認識はヘンだし、Linpack性能や地球シミュレータ(ES)のオカシナ議論を経て、結論の部分で突然飛び出してくる取って付けたような目くらまし的「クラウド主戦場説」は、Linpack性能やスパコンとは全く関係ないもので、論理の飛躍以外の何者でもない。

 それが、Linpackや地球シミュレータなどに対する一連の誤解と共振して、筆者にとっては、何が言いたいの?そんなマーケットの事など始めからわかってることじゃない!といった読んでいて馬鹿馬鹿しい印象しか残らない記事であった。

 反論などするのは時間の無駄と思いつつも、彼の一連の誤解は、自分の屁理屈に合わせるための創作/捏造の類で、いわば、汚水の垂れ流しのようなもので、反論の必要を感じ、それが元で、いつの間にか、記事全般に対してもコメントを加える事になってしまった。


<NYT、WSJなどの記事は普通の分析>

 まず、NYTimesやWSJの記事から述べると、これらの記事はNYTやWSJの意見というより、Top500のco-autherであるUTKのJack DongarraとLBNLのSimon Horstや、VTのWu-chug Feng等へのインタヴューで記事を構成してるもので、彼らの冷静な分析をストーリーにしただけで、何処が「感情に走っている」のか全く理解できなかった。この人はオリジナルの記事を読んで書いているのか不安になってしまう。

 NYT、WSJの記事の内容は概ね以下のようなもので、特段、差し迫った感情的な緊迫感は感じられないし、どちらかというと、余裕の対応のように感じる。

・Tianhe-1Aは、IntelやnVIDIAの市販製品を、中国独自開発のInterconnect(Infiniband QDRの2倍の転送速度)で結合したもので、開発形態はCRAY社が行っているものと同じである。

・これは米国へのwake-up callのようなもの

・同程度の性能のものなら、USの顧客が作る事は可能である。

・日本は単発であったが、中国は長期的戦略で段階的に多くのスパコンを作ってきており、ゆくゆくは独自CPUを組み込んでくるから、長期的には脅威になる。

・こうした意味で米国が保持しているHPCでの優位性はリスクに面しており、米国の将来の経済基盤に打撃を与えるかもしれない。 

・(Tianhe-1AのCPU+GPGPUの方式は)アプリケーション・プログラムにより向き不向きがあり、全てにとって使いやすいわけではない。

・米国には、もっと速く使いやすいsystemの計画がある。



<Tianhe-1Aの影響>

 中国のスパコンTianhe-1Aに関して、現在、世間が大騒ぎしているとは思えないし、今後も大騒ぎは無いであろう。

 技術的には、Intel-HPとnVIDIAの市販品をくみあわせた東工大のTSUBAME2と殆ど同じであるから、70-80億円とスパコン部屋を用意すれば、半年も掛からずにNECとHPが作ってくれる程度のものである。

 マーケット的には、米国製市販品だけで済むものであるから、中国の影響などは考えられない。しかし、価格性能比、電力性能比などの観点からnVIDIAのTesla-GPUの存在感は著しく増加し、Teslaを組み込めるHPやDELLのサーバーによる小規模構成・低価格のSemiCloneが、研究室レヴェルでかなり多く導入されるものと予想され、HPC市場の裾野拡大には、かなりなインパクトがあるのではないかと予想している。
 


<地球シミュレータは汎用機>
 
 彼は地球シミュレータ(ES)が「地球規模の環境変動の解明・予測に最適化されたスパコン」などと言っているが、ESは、そもそも、JAXA、原研、海洋研の共同予算600億円で開発されたもので、設置場所を確保できた横浜の海洋研に設置されただけで、名称も設置場所に合わせておいたほうが予算獲得に便利程度のことであり、航空力学、原子力開発、などを含めた汎用機として開発したのであって、決して「環境変動に最適化」したものなどではない。

 そして後継機(概ね180億円くらい)の選定で、神戸の次世代スパコンを採用しなかったのは、単純に、更新時に、まだ次世代機は存在しなかったからで、SX-9になった理由は、入札にNEC以外参加が無かったからで、そのほか既存プログラムの大規模な書換・変更が無いことなども決め手の一つであったかと思う。

 次世代スパコンとの関連で述べれば、海洋研は次世代スパコンの開発主体に立候補したのであるが、ESの運用の仕方や巨額年間経費などで文科省や関連研究所の覚えが愛でたくなく、開発主体を理研に奪われてしまったのは周知の事実であり、この程度の経緯を押さえないで記事を書くと、一般の人はともかく、スパコン関連の人達からは馬鹿にされる事になる。

 ましてや、Vector機である現在のES後継機(ES2)が「環境変動専用機」であるかのごとき断定は、NECの撤退で崩壊してしまったが、「日本のスパコン戦略は専用機を作る戦略であった」などという頓珍漢な結論に至らしむわけで、笑うに笑えない誤解である。

 そして、ES、ES2の開発を行い、Vector機で次世代スパコン開発に参加していたNECが次世代スパコンから撤退した理由は、公式には「経営環境の悪化」であるが、現実には、国際市場でVector機は、価格性能比、電力性能比、設置面積性能比など、多くのパラメータで、市場競争力を失っていたことが本質的理由である。
 数年後のES2の更新時には、巨額財政赤字の下で、ES2と同等な予算が組めるとも思えず、また、Vector機はなくなってしまっているわけで、プログラムの大規模変更は必須となり、マーケットが存在しない山田流「環境専用機」は後継の選択で手痛いしっぺ返しを受けることになると思う。、
 


<コスト視点: 『国の威信をかけた事業』の現状と巨額税金支出の妥当性>
 
 山田さんは、「市場への影響」とか「市場競争力」などと述べながら、コスト視点を完璧に無視している。 

 今回の中国のTianhe-1Aが投げかけている問題は、単にLinpack性能だけの問題ではなく、開発調達費用が70億円強と推定されているほど安価であることや、市販部品が殆どで、開発期間が極めて短時間で済むことなど、価格性能比、電力性能比、設置面積性能比、部品調達の容易さを含む開発期間、などといったコスト関連の様々な論点が含まれている。
 国際市場では、Tflopsあたりの単価が急激に下がっているにも関わらず、旧態のまま親方日の丸で1150億円もの巨額税金を必要としている神戸の次世代スパコを含めた日本のスパコン戦略の妥当性と再検討の必要性を強く示唆しているという事なのであり、本来、国内で騒ぎが起きないことの方が問題なのである。

 幸いな事に、日本に於いても、中国のTianhe-1Aと殆ど同じシステムがこの11月から東工大で稼働しており、規模は1/2ほどであるが、様々なデータが蓄積されていると思うので、日本のスパコン戦略見直しの参考になるものと思う。


<Linpackに関する誤解: Linpack Benchmarkは、スパコンの必要条件>

 「Linpackは1970年代に開発されすでに時代遅れなのだが、物差しが変わると経年的な比較が出来なくなるので、利用され続けているだけのものである」とあるが、これは本末転倒の誤解以外の何者でもない。
 「経年比較の意味しかない」のであれば、今後は全て新しいBenchmarkを使用することとし、経年比較のためにLinpackを併用すればよいだけなので、ぜひとも、Linpackに代わる、「時代遅れで無い」Benchmarkを提示してもらいたいものである。
 
 これまでもLinpackは無意味だといったような主張がなされてきているが、今までのところ、Linpackに取って代わる新しいBenchmarkは提示されていない。
 要するに、Linpack時代遅れ論者などは、無いものねだりの駄々子で、自分に都合が悪くなると、物差しがおかしいと言い出すが、代わりの物差しは提示できない駄々子に過ぎないという事なのである。

 Linpackに代わる物差しの試みとしてHPCC9項目のBenchmarkがあるが、その主要4項目は、HPL(Linpack)、FFT(フーリエ変換)、EP‐Stream(データ移動)、Random Memory Accessなどである。これらの内で、統合された有意味な作業として性能評価の期待がもてるのはHPLとFFTであり、HPLの守備範囲から漏れているエリアをFFTでカバーするという考え方である。

 これは数値計算の方法論的にも有効なものである。というのは、微分方程式の近似解を求めるには、差分近似-Linpackか、フーリエ級数展開ーFFTが一般的であるからである。

 結局、HPCCというLinpackの代わりのBenchmarkに於いても、相変わらずLinpackは有力なBenchmarkであり、「Linpackは時代遅れ」などといった主張は、的外れという事なのである。

 従って、Linapck Benchmarkでの評価は、スパコンにとって必要条件であることは確かで、十分条件では無いが、スパコンの性能評価には今後とも必要であろう。

 

  
Posted by petaflops at 14:23Comments(0)TrackBack(0) スパコン 04 

2010年10月28日

Tianhe-1A Linpack  2.507Pflops を達成

 2010年10月28日、HPCwireが伝えるところでは、中国国立国防技術大学(NUDT、National University of Defense Technology)の Tianhe-1A はLinpackで 2.507Pflops を達成し、現在のところ世界第1位になったということである。
 このHPCwireの記事は、「現在のところ(today)」という語を挿入しており、11月のSC10でのTop500発表までの暫定といったニュアンスをにじませているので、Top500での第1位が決定したという断定にはなっていない。

 2004年の11月のときは、10月にIBMがBlueGene/Lで地球シミュレータを越したと発表した後に、NASAのSGIのAltix3600によるColumbiaが、そのBlue Gene/Lの値を抜いたと発表したので、皆がNASA Columbiaの第1位は決まりと思っていたところ、IBMはBlue Gene/Lを増強し、11月に入ってからColumbiaを抜き返したと発表し、そのままTop500ではBlue Gene/Lが第1位を確保した、といった過去の例があるため、この時期は結構言葉選びに気を使っているのではないかと思う。

 まあ、過去の例はともかく、今回見えてこないのはNCSAのBlue Watersのデータで、昨年のSC09での超デカ・ボード展示から1年たつので、問題が無ければ、何らかの進捗はあってしかるべきと思うので、どうなっているのかが知りたいところではある。

 Tianhe-1Aに関しては、先のExaScaleのMeetingでの中国科学院のプレゼンよりは若干詳細になり、Tesla M2050を7168台使用し、CPUは14,336台となっているので、1ノード=2CPU+1GPU という組み合わせの様である。電力消費は4.04MW。

 Tianhe-1から1Aへのupgradeで、CPUやBoardの詳細は不明であるが、GPUはATIのRadeonからnVIDIAのTesla M2050に変更になったようである。 とりあえず、CPUはTSUBAME2.0と同等と仮定して、実行性能比を計算してみる。

理論性能
CPU 14,336台 1.100Pflops
GPU  7168台 3.691Pflops
合計         4.791Pflops

Linpack実行値  2.507Pflops

実行性能比     52.33%

中国科学院のプレゼンを元にした実行効率は40%程度であったが、今回のデータからは、Tianhe-1Aは、そこそこの実行性能比を示しているといってよいと思う。

 

  
Posted by petaflops at 19:03Comments(0)TrackBack(0) スパコン 04 

2010年10月27日

ArgonneのCray-XE6 と Stuttgart HLRSのCray-XE6など

<Argonne Beagle>

 2010年10月21日、米Argonne研究所のComputation Institute(CI)はBiomedical分野用のスパコンとして、Cray-XE6(150Tflops,18,000core、ニックネームBeagle)の導入を発表した。設置は1Q/2011である。契約額は公表されていないが、予想としては$5M前後ではないかと思っている。

 Argonne研はイリノイのシカゴ近郊にあり、組織的にはエネルギー省傘下の組織であるが、核開発関連のNNSA傘下の御三家研究所(LANL、LLNL、Sandia)とは別のOffice of Science(OS)傘下の大変大きな研究所で、研究分野も科学全般の多岐にわたっている。
 Argonne研の始まりは、マンハッタン計画に直にリンクしていたシカゴ大の冶金研究所で、核開発の名前を隠すためウランを取り出すような冶金の研究機関としたものである。当時、役に立つのかどうかわからなかった核研究に多額の予算措置を行うことは不可能であり、ドイツや日本への情報漏れを防ぐ意味もあり、別の機関などでは代替エネルギー研究などの名目も使われていた。当時の所長は、Compton効果の発見で、米国で最初にノーベル物理学賞を受けたArthur Comptonで、彼の庇護の下、ノーベル賞授賞式から直接米国へ亡命してきたイタリアのEnrico Fermiが中心となって核分裂の基礎研究を行った由緒のある研究所である。

 ArgonneのCI には幾つかの施設があり、その中の1つはAlgonne Leadership Computing Facility(ALCF)で、2010-June版Top500で第9位の0.5PflopsクラスのBG/P(Intrepit)が設置されている。CIにはBlue Geneコンソーシアムの事務局が置かれており、IBMのソフトには満足せず、自分達でOS等々を開発しているグループがいるなど活発な動きもあり、2012年には10Pflops版のBG/Q(Mira)がLLNLのSequoiaに続いて設置される予定になっている。

 今回、Cray-XE6の導入が決まったのは、Initiative in Biomedical Informatics(iBi)という、Blue GeneのALCFとは別の施設で、ニックネームのBeagleはCharles Darwinが乗っていた船の名前から命名されたものということである。


<Stuttgart HLRS>

 2010年10月26日、Cray社はドイツのStuttgart大のHLRS(The High Performance computing Center, Stuttgart)から複数年複数フェーズで総額$60Mのスパコン設置契約を受注したと発表した。内容的には、2011年にXE6を納入し、2013年後半にCrayの次世代スパコン、開発名Cascade、を設置するということである。性能に関する記述は公表されていない。
 
 Cascadeは、DARPAのHPCS programに於いて ”Adaptive Computing(Heterogenious Computing)" を実現するペタコンとして$250Mで受注したBig Projectであるが、Vector 処理の部分が不調で、昨年暮れ、DARPAとの間で契約見直しの騒動を起こしていたProjectである。

 見直しの具体的内容は承知していないが、今回のHLRSの発表を見ると、2013年にIntelの次世代CPU(多分Sandy-Bridge)を使ってCascadeを納品するとなっているので、機能的には、DARPA向けCrayのAdaptive Computing(Cascade)はIntelの次世代CPU(多分Sandy-Bridge)で実現するということと考えてよいと思う。
 という事は、Adaptive ComputingはCary独自の製品というより、Intelの普通のCPU製品ということなので、特段、Crayに拘ることなく、どのメーカーも製品を提供する事は可能という事になる。

 この見直しによりCrayは、金銭的には、かなりの減額を受けたようで、昨年度の決算は、このDARPAの見直し分が直に決算内容を大きく左右し、結果、小額ではあるが赤字となり、3年連続の赤字決算となってしまった。
 Cray Inc.は、従業員数約850人、年間売上げ約$280M(約220億円Y$80)程度の中小企業であるので、DARPAの契約額は年間売上額に相当し、複数年での売上としても、かなりな比重であったわけで、そのうちの$60M程度が減額された模様で、決算上はかなりな打撃であった訳である。
 多分今年も経営的には厳しい状況にある思えるので、2013年後半での手形を切ってのHLRSとの契約になったのではないかと思う。ここ数年、Crayはかなり綱渡り的経営が続いており、HPC業界は楽ではない。

 HLRSは、数少ないNEC SXのユーザとして、日本に於いては、有名であり、SX-8(1.2Tflops)、SX-9(19.2Tflops)を保持しており、Cluster(Scalar)系も IntelのX5560(Xeon Nehalem、2.8GHz、4core, 2socket)を使った62TflopsのNECのサーバーを導入しており、NEC Favorな研究所であった。
 しかし、同時に、Scalar系としてはCray-XT5m(8.5Tflops)も導入しており、今回のXE6とCascadeの契約につながったものと考えられ、2013年のCascadeを考えると、Vector機能はGPUを内蔵するSandy-Bridge系で置き換え、NECからは離れることになったものと思える。
 まあ、SXの後継の有無やコストを考えると、当面は、TSUBAME2.0のようなCPU+GPGPUタイプで置き換え、その後はSandy-BridgeのようなAVX内蔵系にしてゆくのが流れではないかと思う。

  
Posted by petaflops at 22:04Comments(0)TrackBack(0) スパコン 04 

2010年10月25日

Tianhe、NebulaeのUpgrade情報とTSUBAME2.0

 2010年10月18-19日、ハワイのマウイで、International Exascale Software Project(IESP)の第5回目のMeetingが行われた。IESPは2009年から、一連のMeetingを Santa-Fe、Paris、Tsukuba、Oxfordで行ってきており、今回が第5回目という事になる。Exec. CommitteeにはJack Donngarraほか米欧日の大型スパコン保有組織からの10名ほどのメンツが顔を並べている。
 国際政治でのG8とか、金融財政のG7とかと同様、Top500での力関係から言うと、中国が抜けていることになり、今回、中国科学院のXue-Bin Chiが中国のスパコンの状況を ”The Developoment of HPC in China” としてBriefingし、そのPresentation DocがUpされていた。

 このDocの中で、NebulaeとTianheの状況が以下のように簡単に触れられている。

Dawning Nebulae
 - 600TFLOPS CPU + 3PFLOPS GPU
 - Top500 Rank 2nd
 - Budget 600M RMB
    * MOST 200M, Shenzhen Government 400M
 - Upgrade 1PFLOPS CPU,  200TFLOPS Godson
 
NUDT Tianhe
 - 200Tflops CPU + 1.2PFLOPS GPU
 - Top500 Rank 7th
 - Budget 600M RMB
    * MOST 200M, Tianjin Government 400M
 - Upgrade 1PFLOPS CPU + 4PFLOPS GPU
    * HPL 2PFOPS 
 
 この記述とMeeting 出席者からのTwitter情報により、TianheがUpgradeされ、HPLで2PFLOPSを達成したということになっているようである。確かに、Nebulaeに関してはUpgradeの記述はあるが、HPL等の具体的データは記述されていないのに対し、Tianheには具体的数値が示されており、それがもし目標値であれば出席者が耳で聞いていてその旨注意を喚起するであろうから、この数値は実行結果ということなのであろう。

 数値の精度に関しては、記述全体が、1桁、良くて2桁程度なので、大枠についてであろうと思うが、TianheがLinpack 2Pflopsを達成し、11月のTop500で、第1位になる可能性が高いということのように思える。 
 米国のメディアにおいても、Top500のデータ集積の親方衆の1人であるJack Dongarra氏も中国1位予想説を否定していないといった記事を読んだ記憶があるので、結構信憑性が高いのではないかと思う。
 となると、NCSAのBlueWatersがどうなっているのかは知りたいところであるが、厳しいかん口令を敷いているのか、あるいは、ほんとに出すデータがないのかは、ここ半月ほどで明らかになる。

 Upgraded Tianheの実行性能比は大雑把に、2Pflops/5Pflops=40%ということになるが、プレゼンの中ではUpgradeの内容に関して、何も触れていないので、詳細はわからない。
 GPUが従来のRadeon HD4870x2なのか、Tesla C2050に取替えたのかは不明であるし、CPUも従来のXeon E5540+E5450のままなのか、NebulaeのようにX5670等に変更したのかも不明である。 あるいはBoardメーカに関しても、NebulaeはDawning TC3600であるが、以前からTianheに関しては記述はなく、今回も情報は見当たらない。

 TianheのBoard構成に関しては、2009年11月のTop500サイトの中の記事に、E5540の計算ノードは2CPU 2GPUでメモリは32GBとなっていたので、GPU当りのメモリ量は余り潤沢とは思えない。NebulaeのTC3600に関しては2CPU 1GPUということらしいが、メモリサイズは不明である。

 こうしたメモリ量は実行性能に大きな影響を与えるものと考えられ、実行性能比が低い理由の一つとも考えられるが、如何せん、Original及びUpgradeの詳細内容が明らかでないので、余り有意味な議論は出来ないであろう。

(注1) 


<調達費用比較>
 
 上述の中国科学院のプレゼンで、筆者の興味を引いたのは、筆者の思考傾向からは当然であるが、調達費用の話である。Tianhe、Nebulae共に、600M元(RMB)となっており、 その内の200M元を国の科学技術省(MOST)が負担し、その倍の400M元をそれぞれ深センあるいは天津の地方政府が負担していることである。

 中国の税制の詳しいことは知らないので、これらのスパコンの地方負担ということのお金の流れ的な意味はピンと来ないが、日本は勿論、米国でも、多分欧州でも、基礎科学技術的なものは国の組織下で国の負担が一般的なような気がするので、受益者負担的に2/3 を地方政府に負担させるという方式は、西欧型社会では、所有権、管理権、使用権とかが絡んで結構めんどくさい事になるかも知れない気がした。

 さて、価格に関しては、プレゼンのデータはUpgrade前の調達費用と考えられるのだが、現在の為替レート、1元=12.2196円、1元=$0.150、を適用すると、600M元は約73.3億円、$90Mということになる。理論性能とLinpack実行性能およびLinpack実行性能のTflops単価は以下のようになる。

Tianhe-I <1206Tflops, 563Tflops、1302万円>
Nebulae <2984Tflops、1271Tflops、577万円>
TSUBAME2<2400Tflops、1200Tflops??、222万円??> (??は予想値)

 大雑把に言って、TianheもNebulaeも、GPUタイプのスパコンとしては、CPU鎮一タイプに比べコスト・アドヴァンテージがある様には見えない。どちらかと言うと、設置面積や電力消費のアドヴァンテージの方が大きいように見受けられる。残念ながら、UpgradeしたTianhe,Nebulaeに関してはデータがないので判断しようがない。
 これに対し、TSUBAME2.0はLinpackで概ね1.2Pflops以上が達成できれば、GPUタイプとしての設置面積、消費電力に加えコスト・アドヴァンテージもあるので、国際基準でいっても、結構良い線をいっているように思える。

 TSUBAME2.0が我々に投げかけている本質的問題は、我が日本国の、スパコンに対する基本戦略の問題であり、今時、たかが1台のスパコンのために1200億円もかかけることに何の意味があるのかという事なのであり、その他多くの国立研究機関でのコストに杜撰なスパコン調達に対する厳しい検証の必要性を訴えているのである。

 




***(注1)***

 注1の部分にあった、以下の記述は仕様の誤解釈でしたので削除しました。

< 因みにTSUBAME2.0はノード当り2CPU 3GPUであるが、メモリは52+96GBでGPU当り48GBのようなので、この辺りはTSUBAME1.2からの経験ではないかと思うが、1ノード3GPUのため苦労しているらしい事が見てとれる。>

 TSUBAME2.0のHPのHWの記述(http://tsubame.gsic.titech.ac.jp/hardware-architecture)を見ると、「54GB(一部96GB)」となっており、削除記述は5月頃の若干曖昧な記述を(贔屓目に)拡大解釈したための誤解釈でした。
 一部の96GBのノードを除いて、1GPUあたりのメモリは54/3で18BGと思えます。  (2010/11/02)

  
Posted by petaflops at 23:03Comments(0)TrackBack(0) スパコン 04 

2010年10月21日

TSUBAME2.0の落札公示

 2010年10月12日、文科省の調達情報サイトに、東工大のTSUBAME2.0の公式な落札公示が掲示された。 開札/落札は5月25日であったので、かなり遅い公示である。
 TSUBAME2.0の話題は、HPのサーバーproliant SL390sの発表に付随して、10月5日に、HPCwireとthe Registerが結構詳しく報道していたが、10月14日にもHPCwireはTSUBAME2.0の設置完了の記事を掲載しており、11月のSC10を目前に控えて、中国の競合機Tianhe(Peak 5Pflopas、Max2Pflopsにupgradeしたらしい)などとともに騒がしくなってきたようである。

 
<TSUBAME2.0の復習>

・ 本体:   HP proliant SL390s、
         X5670 (Westmere EP、2.93/3.196Ghz,52/96GB、2socket-153Gflops)
・ GPU:   nVIDIA M2050(Fermi、0.515Tflops)
・ node:   SL390s x1 + M2050 x3  (0.153+1.545=1.698Tflops)
・ rack:   32node (4.896+49.44=54.34Tflops )

・ Main System:       44Rack (1408node、4224GPU、2391.35Tflops)           
・ Additional Servers: HP 4socket server (Nehalem+TESLA) x 34node = 8.7Tflops         
・ Interconnect: Voltair QDR Infiniband、Topology=Full Bisection、BW=200Tera-bps
・ Storage:    SSD+HDD
・ Total Rack:  60、200m**2

・ Software:   "Linux-CentOS&MS Windows HPC" under "XEN for Multi-OS support"  
              on Top of Linux-SLES11


 TSUBAME2.0の理論上のシステム性能は2.4Pflops、Rack性能は54.34Tflops、node性能は1.698Tflopsである。

 TSUBAME2.0のLinpackの実行データは11月のSC10で公表されるであろうから、今この時点であれこれ詮索するのは無粋であるが、Linpack実行性能は、理論性能の半分程度の1.2~1.4Pflopsではないかと予想している。

 理由はTSUBAME1.0(ClearSpeed CSX600、57.7%)、TSUBAME1.2(CSX600+nVIDIA GT200、53.3%)や、中国のNEBULAE(nVIDIA C2050、42.6%)、TIANHE(ATI Radeon、47.1%)、MOLE-8.5(nVIDIA C2050、18.2%)などのアクセラレータ/GPGPU系の実績から、理論性能の50%前後が一つのメドであり、東工大はTSUBAME1.0、1.2の経験があるので、やや高めの60%に近い値も期待し得るのではないかと思うからである。

 類似した形式のものにIBMのPowerXcellを使ったRoadrunnerがあり、理論性能の75.7%を出しているが、PowerXcellは独立したCPUであり、アクセラレータやGPGPUとは若干異なるものと考えるべきであろう。

 TSUBAME2.0のRackの理論性能は54.34TflopsであるがLinpack換算では半分の27Tflops程度と考えると、文科省・理研のKのRack性能12Tflopsの2倍強であり、Capacity的にはLinpack換算で5-7Pflops程度のSystemを狙える能力である。

 蛇足ではあるが参考までに述べると、東大‐国立天文台の失敗作GRAPE-DRが2009年11月に達成したシステム全体の能力(Peak84.48Tflops、Linpack21.96Tflops)は、TSUBAME2.0の1Rack分程度のものと評価され、コストを含めた技術力の差というものをVisibleに見せてくれている。



<調達価格>

 さて、落札公示の話に戻ると、内容は以下である。

落札者:    日本電気
リース期間: 平成22年11月1日から平成26年10月31日まで (4年=48ヶ月)
月額料金:  ¥65,131,500円

 支払総額は31億2631万2千円ということになり、リース諸費用・金利などの加算分を15%と想定してノーマライズすると、
買取推定額は¥26億5736万5200円 という事になる。

 検算の意味で、市販部品などからのbottomup推定の方法で検証してみる。TSUBAME2.0でmainに使用するHP proliant SL390sとnVIDIA M2050の米国での単品の市販価格は、概ね、$7,000(Mem24GB)と$2,500程度と推定される。memoryの増強はMaxの12slot分として$2,400、InfBを$1,000と想定すると、1ノード3GPUなので、ノード単価は$17,900となり、総ノード数1408を計算すると、約$24Mとなり、円換算ではY$90とすると約22.7億円程度ということになる。
 この額から、製造会社のBulk直納であることやアカパックもどきを含めた大幅なDiscountを想定し、たとえば20%引きを想定すると、18億円程度になり、残りの8億円で、SSD、HDDや、システム管理+IO系のサーバー、interconnect関連装置、設置関連諸費用、NECの元受管理費等々を賄えばよいわけで、リース月額から導かれる買取推定額26.6億円は、まあまあ、大きくは外していない数値ではないかと思う。

 細かいことを気にする人は、付帯条件がどうのこうのと神経質になる傾向があるが、付帯条件などの詳細は落札公示には記述されておらず、細かい違いはあったとしても、そうした付帯条件は最終的には性能に収斂されるものと考えれば、大枠を知る上での障害にはならないと思う。そもそも、リース諸費用・金利なども期間やリース会社により結構違いがあり、ノーマライズの精度は高いわけではない。
 Globalな価格比較の大局を知るための、他の有力な方法が無い以上、末節に異論はあっても、この支払総額からのTflops単価は有効な指標であることは間違いないとおもっている。

 以上の結果から、TSUBAME2.0の推定Tflops単価は以下のようになる。

買取推定価格:        ¥26億5736万5200円
推定Tflops単価:       ¥111万円
補正推定Tflops単価:    ¥222万円  (GPU nodeの実行性能を50%と仮定)


 また、GPGPU使用のシステムはコスト的には安いが、HPCとしての使い勝手やアプリケーションの向き不向きなどに加え、既存プログラムからのマイグレーションやポータビィティなど結構不安要素が多い。
 こうした観点からの懐疑のために、TSUBAME2をGPGPU無しで、CPUだけでのシステムとして考えた場合のTflops単価を計算してみると、CPU Only Systemとしての性能は 216Tflops なので、¥1230万円/Tflopsという事になり、最近の導入事例との比較で言うと、京大基礎物理学研究所の日立のSR16000に対しては約2倍ほど高額ではあるが、物性研のSGI Altix ICE8400や先端研のPrimergyには何とか対抗できるような値ではないかと思う。
 このことは、面白おかしく言うと「ここ数年の国立研究機関でのスパコン調達の単価からすると、TSUBAME2の調達では4224枚のGPGPUを無料で手に入れたようなもの」ということになり、逆に、これまでの多くの国立研究機関でのスパコン調達は「何をやっていたのか」という事になるのである。


 TSUBAME2.0の調達費32億円とか、運用経費も含めた総額40億円とかいった額は、文科省・理研のKの開発費だけで総額1200億円前後というプロジェクトの妥当性を問い直すに足る額であり、科学技術予算の適正配分・有効活用という観点からも、Kの見直しは必須であろうし、スパコンの国家戦略の早急な見直しと再構築、それに関連した国立研究機関のスパコン調達の評価・見直しは必須と思うのである。

 

  
Posted by petaflops at 14:20Comments(0)TrackBack(0) スパコン 04 

2010年10月11日

「京(K)」の出荷開始で改めて考える次世代スパコン・プロジェクトの稚拙さ

 2010年9月28日、文科省の次世代スパコン「K」の第1号筐体が出荷され、以後2012年の6月までの「1年9ヶ月=21ヶ月」間をかけて、830台程度を順次出荷してゆくらしいことが判明した。
 土日休暇なしで、日産1.3台、週産9.1台、月産40台、程度である。21世紀の現在、こんな暢気な製造計画が有りなのかと思わざるを得ないような、19世紀的家内工業的腐臭の漂う、蝸牛出荷計画である。
 (注)理論値10Pflopsで833台程度、Linpack10Pflopsだと1000台程度は必要。

 世界のスパコン業界を常識的に眺めてみて、10Pflopsを2010年10月に達成するなら世界1の可能性はあるが、2011年6月では「見込み薄」、2011年10月では「ほぼ絶望」、2012年6月では「絶望」、と考えてよいであろう。 

 「世界一奪還」というプロジェクト目標を承知の上で、絶望蝸牛出荷計画を承認していた文科省・理研の「無責任さ」には、ほとほと、あきれ返るだけである。


<「落ち」の付いた「お笑い」国家プロジェクト>

 生き馬の目を抜くような熾烈な性能競争を演じている国際スパコン業界の中で、世界一奪還を錦の御旗に掲げ、税金を腹いっぱい囲い込んだ文科省・理研が、自らのオリジナルな製造計画で、量産試験完了後の、アッセンブリ開始から完了までに1年9ヶ月も掛けるプランであったなどということは、滑稽千万、とても信じ難いもので、この間の抜けたプランを承認していたことは、将に、背信といわれても仕方のないような頓珍漢な行為である。

 誰にでもわかることであるが、「1年9ヶ月=21ヶ月」、という長さは、半導体のテクノロジーが世代交代を起こすに足る期間であり、それに従って、CPUもメモリも、あるいはsystem本体も世代交代するに足る期間なのである。設計試験が完了し、量産試験も終わった後の純アッセンブリに21ヶ月掛かるなどということは、system.を組み立てている間に、systemの世代交代が起き、そのsystemは陳腐化してしまうわけで、永遠に、最新世代にはなれないといった「お笑い」プロジェクトプランという事なのである。
 
 この文科省の次世代スパコン・プロジェクトは、文科省が日本の基幹科学技術に指定している大国家プロジェクトであるが、昨年5月のVector部撤退により、基幹科学技術としてのコンフィグレーションはあっけなく崩壊してしまった大問題プロジェクトである。この大失態に加え、今回明らかになったのは、Vector部がなくなった片肺コンフィグレーションに於いても、製造がネックになって世界一にはなれないといった「お笑い」プロジェクトであるという事である。

 そして、このお笑いには「落ち」が付いていて、そもそものオリジナル・プランで「世界一にはなれないような自己矛盾の計画」を立てておいて、後で、この自分で埋め込んで置いた「矛盾」を取り除くためには多額の追加税金が必要などといった「落ち」が付いているのである。これは、納税者から見れば、「計画詐欺」のようなもので、「このプロジェクトは詐欺」だと非難されても反論の余地はないのではないだろうか。

 
<原因は800ラック超>

 こうした製造計画のいい加減さの原因の一つが、800台超という、馬鹿馬鹿しい数の台数問題がある。筆者は数年前から本ブログの中で、ラック数が256台を越えるようなsystemは異常で、設置面積、Usability,Availability,Maintenability、等々、あらゆゆる面で問題を来たす駄目systemと指摘してきたが、この度は、製造工程においてすらも台数問題が大問題の原因になっているということが判明したわけである。
  
 SPARC64-VIIIのチップ性能は128Gflopsであるから、  10Pflosp=10,000Tflops=10,000,000Gflops を実現するためには、概ね80,000チップ必要ということになり、取り巻き部品を含めた80,000セットの製造に21ヶ月(約640日)掛かるということである。逆算すると、土日休暇無しで、日産で125セット程度ということになる。

 Kのラック性能は12Tflopsで、SPARC64-VIIIを96チップ収容しているため、一日125セットのSPARC64では、組立可能なラック数は一日1.3ラック程度ということであり、833ラック超を製造するのには640日=21ヶ月必要という計算になるわけである。

 もし、Kのプランが、常識的な、256ラック程度であれば、現状の生産能力でも、6か月程度で製造は完了することになり、一般的には、この生産ライン能力が特別弱体であるとは思えない。

 こうしたアンバランスはプロジェクトプラン作成時点でわかっていたことであり、製造ラインを強化しない限り「世界一」達成は難しい事ぐらいわかっていたはずである。

 要するに、プロジェクトプランがいい加減、という事であり、本質的には、SPARC64-VIIIのチップ性能で、無理やり833ラック超も必要な、可笑しな「水増し」システムを計画したことが問題なのであり、製造の観点からも、KがCPUチップ性能を無視した「駄目システム」である事を示しているのである。


<生産増強100億円超の予算は無駄金>

 現実問題としては、生産能力を上げるにはSPARCの生産ラインを増やせばよいわけであるが、この生産ラインの増強に必要な資金をどうするかが問題である。

 SPARC64-Ⅷが世界の市場で継続して日産125セット以上多数売れる見込みがあれば、なんの問題もなく、製造メーカーである富士通が資金を調達するはずであるが、売れる見込みがなければ、メーカは投資に二の足を踏む。

 自ら進んで投資をしないということは、富士通側は、世界のスパコン市場で、SPARC64-Ⅷが、生産ラインを増強するほど売れる見込みがないと判断していることを示している。

 今時、売れる見込みのない製品に追加投資をするほど、お人好しの経営者はいない。生産ライン増強の追加投資は、Kのためだけの一時的要求で、商業ベースの生産とは関係なく、単なる一時的特注費用という事で、必要であれば、文科省・理研が追加費用を負担をしてくださいという事である。

 こうした文科省・理研の大失態の尻拭いのためだけに、100億円超といわれている経費を、補正予算だか本予算だかで支払う事など、全く、無駄金以外の何者でもない。経済効果の観点で考えても、今後市場で売れる見込みのないKの製造ライン増強など、何の意味もなく、全く無駄金である。



<補正予算で市場からスパコンを調達すれば、丸儲け>
 
 この額で、同じスパコン分野への有効投資を考えるなら、一般市場からのスパコン調達を考えたほうが遥かに遥かに有効である。今100億円の金を出すなら、軽く2-3Pflops、上手く入札させれば4-5Pflops、のスパコンは、すぐにでも、調達可能と思えるので、これを神戸のVector機の空きスペースに設置すれば、遅れて出てくる国策スパコン「K」の、早期の埋め合わせになるうえ、その後は、自由に使えばよいわけで、日本国としては、丸々2-5Pflopsを無償で手にいれたような結果に成るのである。

 そして、この2-5Pflopsのスパコンを、ポスドクのスパコン・デバイド連中などに安く使わせれば、科学技術振興への効果は、計り知れないものがある筈である。

 現在、我が国のスパコン関連施策の喫緊の課題は、世界第1位とか2位とかいった馬鹿げた競争ではなく、科学技術の足腰としてのスパコンの総台数とそれらの総計算能力の増進である。

 スパコンのハードなどは「唯の箱」、スパコンの心は「使い方」、つまり「ソフト」。

 ソフトウエアの飛躍的進歩は、PCの出現によるもので、それまで高価で不自由なMainframeでしか出来なかったソフト開発が、PCの出現により、個人が安価に必要なだけ機械を専有できるようになったことに因っていることは自明であろう。

 同じようなことが、スパコンのソフト開発にも当てはまるのである。高価で使いづらいセンター方式は、個人の創造性、生産性に対し多大な障害となっているわけで、出来ればパーソナル・スパコンが最良であるが、そこまでは行かなくでも、院生ないしは、ポスドクなどの若い連中が、出来る限り安価に長時間スパコンを専有出来る環境整備を行うことが、新しいスパコン・ソフトの創造に、最も効果的であることは、論を待たないであろう。
 
 まあ要するに直裁にいうと、文科省のスパコン予算の使い方・監査などは出鱈目であり、文科省のスパコン戦略は、方向性で極めて大きな誤りを犯しているということに尽きる。

 その誤りの最大の原因は、ハードとソフトのバランス感覚の無さで、「ハードは唯の箱」という感性に欠け、投資先はハード優先でソフトはオマケといった30~40年くらい前のハード万能の感性であり、そのハードに関しても、コスト意識が完璧に欠落していることである。

 このコスト意識のなさが、スパコンのテクノロジー・トレンドを見誤り、勝てないVector機と心中騒動を起こしたり、市場では売れないような総合チップ性能の劣る競争力のないCPUを製造が間に合わないくらい「ジャブジャブ」水増して、勝てない性能競争を煽ったりしたわけで、多額の税金を無意味にドブに捨てるようなことになってしまっているのである。
 
 
<日本のIT関連メディアのいい加減さ>

 この出荷の話題はNHKニュースでもとりあげられ、さらにはIT関係のメディアにも結構取り上げられている。

 傑作なのはPC-Watchで、製造会社は「生産体制も改善」との小見出しをつけ、「究極の平準化生産」に取り組んだと張り切って記事にしているのであるが、どっこい、その結果が1年9ヶ月に及ぶ「前代未聞の蝸牛納品」になったわけで、この記事は、将にこの「究極の平準化生産」が、プロジェクトの大目標である「世界一」達成不可の原因であるという事を理解していない、頓珍漢記事なのである。

 と同時に、この製造会社は、21ヶ月の間、理研向け製造に掛かりっきりで、この製品(K)を別の顧客へは納品は出来ないわけで、言い換えると、Kは別の顧客には全く売れない、ということを証明しているわけである。

 まあ、この「究極の平準化生産」で益を得るのは、親方日の丸の製造会社くらいで、この記事が、「究極の平準化生産」に焦点をあて、本来のプロジェクト目標とのミスマッチや、本来のプロジェクトプランの不備を指摘しないのは、公平な情報を提供する筈のメディアとして失格である。こうした単純な問題点を指摘しないことは、全く疑問であり、いい加減な提灯記事といわれても反論は難しいであろう。

 また、Cnet-Japanでは、「解説」などといった上目線で「解説:富士通の「京」出荷開始で改めて考える次世代スパコンの存在意義」などと、世界のスパコンの現状を全く知らないらしい「井の中の蛙」君が、ただただ富士通の担当者の言を組み合わせて「存在意義」を述べているつもりらしいのだが、世界の先端機との比較検討に基ずく「存在意義」の解説はないし、800ラック超などという「超水増し」システムの「存在意義」の解説もない。また、仕分けで遅れたわけではなく、オリジナルなプランで、2012年という驚くべき蝸牛生産計画に対する「存在意義」の解説も無い。余りに一方的な唯我独尊的解説で苦笑せざるを得なかった。
 せめてもの救いは、この記事は本家の米Cnetの記事ではなく、単に日本のITメディアCnet-Japanの独自提灯に過ぎないらしいことである。

 

  
Posted by petaflops at 00:27Comments(0)TrackBack(0) スパコン 04 

2010年09月29日

国立研究機関のスパコン調達のTflops単価推移

<国立研究機関のスパコン調達のTflops単価推移>
                                    理論 推定Tflops単価
                                   Tflops (@百万円)

2008 京大     T2K  AMD-X86    富士通   70.2   48
2008 東大     T2K  AMD-X86    日立    140    50
2008 筑波     T2K  AMD-X86    Appro   95    20
2008 JAXA          SPARC64-VI  富士通  135.7   69
2008 海洋研機構      SX-9       NEC    131   116

2009 北陸先端大 Cray-XT5 AMD-X86  Cray   19.6   20
2009 理研     Primergy Intel-X86  富士通   97.9   30
2009 原研     Primergy Intel-X86  富士通  200    30 ?


2010 東北大    SX-9+Express5800  NEC         100 合算
             Express5800単体推定         1.7   33   
2010 東大物性研 SX-9+AltixICE-8400EX SGI        114 合算
             AltixICE単体推定            180    8  
2010 東工大    HP+nVIDIA     HP+NEC   2400    1.3 ? 
2010 東大先端研 Primergy B922             39.3  10
2010 京大基物研 SR-16000-XM1 Power7 日立   90.3   6               

参考:
2010 Korea気象庁   Cray-XT6       Cray   600    6  (Y$90)
2010 UT-TACC     Dell-M610     Dell    302    2.5(Y$85)


参照:
地球シミュレータ後継機
地球シミュレータと阪大のSX-9
T2K(筑波、東大、京大)とJAXAのスパコン(2/2) <JAXA>
・T2K(筑波、東大、京大)とJAXAのスパコン(1/2) <T2K>

北陸先端大のCRAY XT51/2
北陸先端大のCRAY XT5 (2/2)<税金の価値>&<為替レートと産業空洞化>
Korea気象庁 2010年にCrayの600Tflops機を導入 (理研、原研)
東北大のNEC Express5800 と CrayのBaker
TSUBAME2.0(2.4Pflops) NEC+HP連合が落札
・京大基礎物理学研の日立SR16000-XM1とTexas大TACCのDell-M610

東大物性研のSGI Altix ICE8400EX
東大先端科学技術研究センターの癌治療薬開発専用スパコン


(注)
 上記リストでのTflops単価は理論性能に対するものです。 以前は理論性能に対し、Linpack等の実行性能が50%以下とか、60%程度といったスパコンが数多くあり、理論性能の信憑性がなかったのですが、最近は多くの大型スパコンは、Interconnectの進化やLinpackのTune-Upが良くなった事もあり、70%以上が普通で、80%、90%などのものも多くなっており、単価計算は理論性能を基にしました。
 ただし、東工大のTsubameのような「GPGPU+CPU」typeのシステムの理論性能に関しては、従来の単純合算法では実行性能との乖離が大き過ぎ、50%以下のものが多いので、注意が必要です。

  
Posted by petaflops at 22:37Comments(0)TrackBack(0) スパコン 04 

2010年09月27日

東大先端科学技術研究センターの癌治療薬開発専用スパコン

 2010年8月5日、東大先端科学技術研究センター(先端研)は富士通と共同で、癌の再発・転移治療薬開発専用のスパコンを構築し、8月1日から稼働を開始した旨発表を行った。
 これは、国の最先端研究開発支援プログラムからのFundによるもので、富士通のBlade Server 「Primergy BX922 S22」を 300Blade並べて構成さるシステムで、理論性能は38.3Tflopsで、費用は約4億円と報道されている。


<Primergy BX922 S22>

 Primergy BX922 S22では、CPUはIntel Xeonシリーズの中から選べるようになっているようで、先端研のSystemは以下である。

CPU       Xeon 5650 6core
Clock      2.66GHz
Mem      12MB
Chip Peak  64Gflops

Blade      2socket(Chip)
Blade Peak 128Gflops
node      =Blade=2socket

Interconnect Infiniband QDR 4GB/s
HDD       1PB (Raid6) 

System     300node(Blade)
System Peak  38.3Tflops

<Tflops単価>

 費用の公示データはないが約4億円と報道されている。設置の経緯やFundの形態からして、リースなどといった事は考え難いので、単純にTflops単価を計算すると、約1,000万円/Tflopsという事になる。
 
 この先端研のPrimergy Systemの約1,000万円/Tflopsは、2009年の北陸先端大に設置されたCray-XT5の約2,000万円/Tflopsに比べれば、1年の時間差で半値であるが、2010年5月の東大物性研のSGI Altix ICE8400の約800万円/Tflops、2010年に設置予定のKorea気象庁のCray-XT6の約600万円/Tflops、2010年9月の京大基礎物理学研究所の日立SR16000-XM1の600万円/Tflops、に比べると割高ということになる。

 また、京大基礎物理学研究所の稿で述べた、米国U-Texas TACCのLonestar後継機の300万円以下/Tflopsに比べると遥かに高い。


<汎用実験装置としてのスパコン>

 先端研の「癌治療薬開発専用スパコン」という使い方は、今後のスパコンの使い方として極めて重要な使い方である。

 いわゆる、従来からの、センターに鎮座するスパコンを、多分野の人達が、広く浅く使う、という従来の使い方は、「無いよりは益し」程度の話で、スパコンを道具・実験装置などとして使込むといったレベルの話からは程遠い。

 専用スパコンという考え方は、スパコンというより、「専用の汎用実験装置」と考えるべきで、こうした実験装置を多数保持する組織・国が、今後の科学技術開発において、圧倒的に有利になることは明らかである。1点豪華主義などは基礎体力という観点からは殆ど無意味で、裾野を十分に広げない限り、有意味な、国力は根付いてこない。

 こうした意味で、国内の各研究機関が、従来の高価なヴェクタ機の呪縛を振り払い、実験装置としての廉価な高性能スパコンに目を向けだした事は、ご同慶の至りである。

  
Posted by petaflops at 19:01Comments(0)TrackBack(0) スパコン 04 

東大物性研のSGI Altix ICE8400EX

 2010年5月20日、日本SGIは東大物性研から理論性能180TflopsのAltix ICE8400EX システムと理論性能6.6TflopsのNEC SX-9を受注したことを発表した。 公示情報によれば、期間は2010年7月1日から2015年3月31日までの4年9ヶ月で、支払月額は約4,400万円である。

 理論性能の180Tflopsは、同じ東大の情報基盤センターのT2Kの140Tflopsより遥かに高性能で、しかも、価格もかなり安価であり、京大・基礎物理学研究所の日立のSR16000-XM1と同様、国立の研究機関におけるスパコン調達に新たな一石を投入した様に思う。 

<物性研 Altix ICE8400EX System>
 CPU  Xeon 5570  4core
 Clock 2.93GHz
 node  2 socket
 Total 1920 node (3840socket, 15360core)
 Peak   180Tflops
 
   
 Total Mem 46TB
 Storage  91TB 


<Tflops単価>

 支払総額は月額4,400万円で4年9ヶ月なので、約25億600万円ということになり、リース加算分を15%程度と仮定すると、推定価格は約21億3,000万円となる。

 SX-9の単価は東北大のセンターの例から推定すると約1億円/Tflopsteidoなので、物性研の6.6Tflops機は6億6,000万円という事になり、Altix ICEの方は約14億7000万円ということになる。従って、物性研のAltix ICE8400EXのTflops単価は約800万円程度と推定される。

 他方、2010年6月1日付け日本SGIのAltix ICE8400の発表文書の中の参考価格には、Xeon5600、2.66Ghz、192core版の値段が約2,200万円と なっている。このConfigurationでの性能は2Tflopsと計算されるので、この参考価格からは単価は1,100万円/Tflopsと計算され、大量導入とアカパック等のDiscount要素に、InfinibandなどのInterconnectやHDDなどの加算コストを考慮してみると、800万円/Tflopsという推定値は「当らずといえども遠からず」の数値ではないかと思う。

<Cray-XT5、XT6との比較>

 SGIのAltix ICE8200は、米国ではNASAのPlaiadisで使用されているもので、ICE8400はその後継である。NASAはPlaiadisにICE8400を追加導入し、Pflops機に向けた増強を図っていると報道されており、世代的にはICE8200はCrayのXT5に、ICE8400はXT6に対応すると考えてよいと思う。

 価格的には、2009年に北陸先端大に導入されたXT5は約2,000万円/Tflopsであり、2010年導入予定のKorea気象庁のスパコン(XT6?)は、600万円/Tflops程度と推定される。

 物性研のICE8400の800万円/Tflopsという単価は、Korea気象庁のXT6に比べると割高感はあるが、北陸先端大のXT5に比べれば、規模の違いもあるが、前進であろう。ただし、最近の京大・基礎物理学研究所の日立SR16000-XM1の600万円/Tflopsは更に前進しており、更なる国際価格への収斂が期待される。

  
Posted by petaflops at 01:53Comments(0)TrackBack(0) スパコン 04 

2010年09月11日

京大基礎物理学研の日立SR16000-XM1とTexas大TACCのDell-M610

<日立SR16000-XM1>

***(訂正情報 2010年9月17日追加)***
 文科省の調達情報に、当該基礎物理学研究所のものと思える落札公示が9月1日で公表されていましたので、本文中の、総額及びTflops単価関連の記述を訂正いたします。
 公示では、5年リースで、月額10,706,325円となっていますので、5年間でのリース総額は642,379,500円という事になり、ノーマライズした価格は約5億5千万円程度と予測されます。これに伴い、Tflops単価も600万円/Tflops程度に下がることになります。
*********************


 2010年9月8日、日立製作所は京大基礎物理学研究所から同社のHPCサーバーSR16000-XM1(90.3Tflops)の受注を受けた旨の発表を行った。基物研は、これまで、NECのSX-8、及びSGIのAltix3700を使用しており、概ね1.6Tflops程度の総合計算能力を有していた。

 日立のXM1は、CPUにIBMのPower7を使用しているスパコンである。概要仕様から判断してIBMのPower755と同等と思えるので、Power755の仕様を参考にしながら、細かく見てみる。

 Power7は1chip=8coreで、XM1はこのPower7 CPU1基を小カードに125GBのメモリ等と一緒に実装し、プロセッサカードとしている。作動クロックは3.3GHz、Chip性能は211Gflopsでり、プロセッサーカードの性能も211Gflopsである。そしてこのプロセッサカード4枚を4UのChassisに挿入したものをNodeとし、Node性能はChassis性能と同じで0.844Tflopsである。

 XM1のChassisは4Uなので、Rackには4chassis程度は収容可能と思えるので、Rack性能的には3.38Tflops程度と考えられ、x86系と同じような性能Levelと判断される。
 基物研のスパコンは、このNodeを107台(Rack数では27台程度)集めたもので、理論性能は90.3Tflopsということになる。5年で約7億円程度と報道されている。
*(訂正)落札公示では月額月額10,706,325円で、5年総額約6億4237万円)

 
<Tflops単価>

 今のところ、落札公示のデータが公開されておらず、メディア報道だけなので、正確な価格情報ではないが、5年リースの総額が7億円と考え、ノーマライズした価格を予測してみると、概ね、6億円前後で、Tflops単価は650万円程度ということになる。
*(訂正)落札公示を元にすると、ノーマライズした価格は約5億5千万、Tflops単価は600万/Tflopsと推定される。

 この650万円/Tflops程度(*訂正後は600万円/Tflops)という単価は、北陸先端大のCray-XT5の推定導入単価(約2000万円)に比べるとかなり安くはなっているが、それでも現在の推定国際相場の2倍ほど、割高である。

 しかし、支払月額は1400万程度(*落札公示では月額約1,070万円)ということで、この程度であると、国内主要大学に所属する研究所単位で調達が可能な額であり、今後、様々な、大学内研究所が100Tflops程度のスパコンを調達することはブームになるのではないかと思う。
 問題は、国内メーカーが、高くてもこの程度の単価、できれば、国際相場の単価で、スパコンを提供できれば、文科省の次世代スパコンなどをあてにせずとも、各研究機関が使い勝手の良い自前のスパコンを保持する事が可能となるわけで、学術・研究の振興には計り知れない効果が期待できるのである。


 <NCSA Blue Watersとの比較>

 HPC業界でPower7はNCSAのBlue Watersに使われていることで注目を集めているわけであるが、同じPower7のChipを使っているが日立のSR16000-XM1とは構成がかなり違っている。

 前述のXM1のBuilding Blockは今年2月に発表されたIBMのPowerサーバーの系列のもので、XM1はPower755と同じ構成と見受けられる。そして1processor-card=1chipという構成はX86系でよく使われる構成であるが、MCMが主流のPower系としては新しい構成で、空冷である点を含めて、コスト的にX86系を意識したものではないかと思う。

 これに対しBlue Watersは、従来からのPower chipの構成を踏襲し、4ChipとMemoryをMCM(Multi Chip Module)に実装し、このMCMを更に大きなMother Boardに8個実装しているもので、この2UのMotherboardは液冷であり、Packagingレベルでの集積度は極めて高いシステムとなっている。

 Blue WatersのPower7は4Ghz駆動なので、chip当り256Gflopsなので、1MCMで1Tflopsとなり、1Motherbordで8Tflopsということになる。Rackには、この2Uの大型Motherboardを12台設置可能なようなので、1Rackで96Tflopsという非常に高い集積度になっている。
 
 XM1の場合、Packagingにおいて、CPUのMCMは採用されておらず、単純に1Chassis(Drawer)に4プロセッサカードであるので、このChassis性能がBluewatersのMCMに対応することになり、BlueWatersのMotherboardはMCMを8基収容するので、packaging密度はmotherbordの大きさと高さ(4Uvs2U)を考慮して8倍程度の差はあるように判断される。勿論、この密度の違いは空冷vs液冷によっていることは明らかであろうけれど、MCMを使わないプロセッサ・カード方式などはX86系の売り方を意識しているであろう事も想像に難くない。


<Texas大TACCのDell-M610>

 2010年8月30日、米Texas大のTACCは、同センターに設置済みのDell社製のスパコンLonestar(理論性能62Tflops、Dell PowerEdge1955)の後継機として理論性能302TflopsのDell PowerEdge Blade Server M610を導入する旨の発表を行った。これはNSFの予算によるもので、$9Mが認められたとしている。

 TACCにはいくつものスパコンが設置されており、有名なものには、2008年設置のNSF HPC FundによるRanger(理論性能579Tflops)があるが、このLonestarはNSFのTeragrid用のためのもので、その置き換えということである。

 Dell M610はIntelのtwo-6core Westmereを使用しているもので、12/2010にLimited Use、early/2011にGereral Useというscheduleとなってる。
 
 Lonestarの302Tflops で$9M(7.65億円/¥$85)という調達額は、かなり魅力的なもので、単価的には、253万円/Tflops(¥$85)である。最近の円高は激しすぎ、過去のTflops単価比較で使用していた110円、100円、90円などとは差が大きすぎるので、¥$100としても、298万円/Tflopsである。 
 このデータを元にすると、安いと思われている前述の京大基物研のXM1の600万円/Tflopsですら、TACCのLonestarの2.2~2.5倍という事になり、未だに、スパコンの内外価格差は、大きく存在するといってよいのではないかと思う。

  
Posted by petaflops at 07:26Comments(0)TrackBack(0) スパコン 04 

2010年08月06日

理研のNECに対する損害賠償調停申立

 2010年7月27日、理研は、次世代日の丸スパコンからのNECの撤退に対し「(NEC分の)スパコンの収容施設の建設を進めたため、無駄な投資をさせられた」(2010年7月27日22時37分 読売新聞)として損害賠償の民事調停申立を行ったと報道がなされている。
 翌29日の日経新聞には、文科省の副大臣が「国として資本を投じてきた。(撤退について)ああ、そうですかとはならない」と述べたと伝えている
 理研は公式発表を行っていないようなので、あくまで、新聞報道を基にしたものではあるが、上述の副大臣発言の報道もあり、大筋はこのとおりと考えて良いであろう。

<文科省中間評価作業部会の機密ヴェクタ部不要論、訴訟は困難>

 この件のおさらいをすると、事の起こりは、2009年4月の次世代スパコンに対する文科省の中間評価作業部会が行った中間評価で、今考えると、これがこの件の始まりであった訳である。当時、作業部会の評価内容は意図的に機密名目で国民には公表されることはなかったので経緯がハッキリしていなかったのであるが、裏でこれがトリガーとなっていたようである。
 そして同5月に、突然、NECが次世代スパコンの製造段階には参加しないという形での撤退表明があり、撤退理由は「同社の経営状況の悪化」であった。
 NECの撤退を受け、作業部会は理研にシステム構成の変更を求め、理研はそれまでのヴェクタ・スカラ両輪論を捨て、スカラ単一システムでの開発継続を決め、同7月に評価作業部会はシステム構成変更を含めた中間評価報告を公表した。
 そして、同8月の総選挙の結果、政権交代が起こり、それに関連して政府事業の事業仕分けが行われることになった。
 次世代スパコンも事業仕分けの対象になり、同11月に行われた事業仕分けのなかで、理研は、NECの撤退に対し、損害賠償を請求すると発言した。と同時に、一般公開の事業仕分けにおいては、法的に正統な理由のない機密指定などは維持できない状況に追い込まれていったのである。
 その結果、2010年1月に到り、これも唐突感が否めないものであったが、文科省は、2009年7月に発表した中間評価報告には、米国との競争状況(法的正当性は無い)を理由にした、非公表の機密部分があったことを認め、その上で、仕分けに於いて、世界1位を獲得するための予算措置が否定され、機密保持の必要性がなくなったとして、その機密部分の指定を解除した形の報告書を公表した。
 その中には、2009年4月の中間評価作業部会において、「現状では複合システムとしての性能は不十分」「プロジェクト目標を念頭に置いた最適なシステム構成を再検討すること」(報告書添付資料1)などとされ、暗に「ヴェクタ部はプロジェクト目標に貢献しておらず、資金面から、ヴェクタ部は捨て、スカラ単一システムに集中することが必要」との評価がなされていた事が記述されていた。

 この事実は、NEC撤退の真の理由が、公式な「経営悪化」ではなく、この中間評価作業部会の意思をNECが斟酌した結果なのではないか、という疑問を惹起する事になった。
 要するに、「作業部会が不要といったので、NECは撤退した」というのが本旨で、「経営悪化」という公式理由は、経営環境超悪化の中、「不要」と評価されたものに、国家プロジェクトだからといて、身銭を切って経営資源を割くことは出来ないし、余裕もないという、極めて普通の経営判断ということで、トリガーを引いたのは「作業部会のシステム構成再検討決定」と判断するのが妥当であろう。

 となると、事業仕分けでの賠償請求実施発言は、この4月の作業部会での経緯を理解していないのか、知ってはいても機密で隠しとおせると思っていたのか、とにかく無責任な発言ということであり、そもそも理研がNECを訴えることなど出来ないのではないか、ということになるのである。

<法的賠償請求ではなく、調停>

 そして、事業仕分けでの賠償請求発言から8ヶ月の紆余曲説を経て、2010年7月にやっと賠償請求の申立を行った訳であるが、この申立はキーになる以下の2点で、どちらも激しいピントズレを起こしているのである。
(1)この賠償請求は「民事調停」であって「民事訴訟」ではないこと
(2)賠償が「開発契約」に対するものではなく、「無駄な施設投資」に対するものであること

(1)の「民事調停」に関しては、契約違反があったのなら単純に「民事訴訟」を起こせばよいわけで、訴訟を起こせずに「調停」でしか賠償請求出来ないということは、「契約違反はなかった」ということの裏返しと考えてよいであろう。これは、前述の2009年4月の作業部会での結論がNECの撤退の真の理由であったということを、認めたようなものと考えられる。
 また、開発契約的に考えても、このプロジェクトは「設計段階」「製造段階」などとなっているので、契約は[段階]ごとのものであろうから、通常は、設計段階の成果物を納入し、検収を受けていれば、この段階は完了で、次段階に参加せずとも、法的に賠償請求を受けることなど考えられない。
 しかし、文科省・理研側は、事業仕分けで公式に賠償請求を行うと発言した手前、賠償請求せざるを得ず、その結果が、「賠償請求の調停申立」という「アングラでのクリンチ作戦」だったのである。
 政府公共調達という巨大ビジネス・ヴォリュームを背景とした、暗黙のビジネス圧力の下で、NECから何某かの賠償を得て、事業仕分けでの発言に色をつけようといった、小賢しい公務員の目論みであろうし、(2)の、全く訳の判らない「無駄な施設投資に対する損害賠償の調停申立」の実態であろう。
 まあ、ハッキリいって、この申立ては「いちゃもん」の類としか思えない。法的に正面から「支払った設計費の奪還」を主張できないため、「調停」の俎上に上げるための、なりふり構わぬ「言いがかり」で、例の老害氏の大好きな「歴史の法廷」に堪え得るようなものとは、とても、思えない。

<巨額税金無駄使いの責任は文科省・理研>

 文科省・理研側としては、「国として資本を投じてきた。(撤退について)ああ、そうですかとはならない」という前述の副大臣発言のとおり、国民に向けて、正義の副大臣様が不届き者を懲らしめ、「少しでも払った血税を取り戻した」という実績つくりなのであろうけれど、この奪還作戦は筋が悪い。実態は「悪者は副大臣様のお身内のもので、NECは関係ない」という構図だからである。
 というのは、事の起こりは、始めに「ヴェクタ部不要論」を指示したのは文科省の作業部会であり、これは、プロジェクト・マネジメント視点で見れば、「発注仕様の変更」という事で、発注側、つまり、文科省・理研、の責任であり、受注側のNECに責任はないからである。
 初期発注仕様に基づいて仕事をしてきたNECは、それまで掛かった作業代金を返還する必要など「さらさら」ないし、また、「発注仕様変更」で生じた「施設投資の無駄」も、文科省・理研側が負わねばならない「無駄」なのである。
 副大臣は、NECが身勝手に撤退したと誤認しての発言と思えるが、仕分け時には機密として公表されていなかった4月の作業部会での決定は、ヴェクタ部開発を縮小廃止し、予算をスカラ部に集中させる指示であったわけで、この変更指示に伴う責任は、全て文科省・理研が負うべき筋のものなのである。当該副大臣にどれほどの認識があるのか定かでないが、文科省の担当者に丸め込まれた副大臣殿は、哀れにも、「天に唾をはいている」という構図になっているのである。
 従って、勿論、施設に関しては、NECが賠償しなければならない理由は何もないと思うので、賠償など拒否すればよいと思うが、どっこい、法的黒白を求める「表」での訴訟ではなく、何でもありの「絡めて」からの「お話合い」の調停であるから、長い将来にわたって続くであろう公共調達視点の暗黙の圧力は、NECにかなりな重圧になると思うので、結果の予測は難しいということになる。

<蛇足>

 筆者は3年前に、「次世代日の丸スパコンは大丈夫か?」でこの次世代スパコン・プロジェクトのプロジェクト・マネジメントのいい加減さを指摘し、今回のような事態が起き得る事を指摘していたし、同様に、「日本のスパコン戦略はボロボロ」で述べたように、戦略そのものが今日の世界のコンピュータ・テクノロジのトレンドからは浮き上がった、おかしなもので、税金が意味なく浪費される構造になってしまっていることを、3年前に指摘した。
 原因は、勿論、この戦略を立案した人達の、能力・知力が極めて劣っていたということで、世界のコンピュータ・テクノロジのトレンドを全く理解できていなかったという事に尽きるわけである。

 この件の本質的問題は、日本国の国家基幹科学技術としての文科省の次世代スパコンのヴェクタ・スカラ両輪論という戦略は、完璧に崩壊してしまったのに、この戦略立案に対する責任の追及と反省が全くなされていないという事が大問題なのであり、文科省および理研の責任こそが追及されねばならないのである。
 残骸として残ったスカラ単一機も、異常なラック数による時代錯誤の水増しシステムで、維持経費も膨大で、現在、世界中で受注販売されている市販スパコンより性能が劣り、本来のプロジェクト目標達成は困難とされている代物で、こんなシステムに1200億円もの税金を投入した、文科省こそ責任を追及され、処分が行われなければならないはずである。

 筆者は、今日、アーキテクチャ的にCray-1やSXのようなヴェクタ機は不要と判断して、文科省のヴェクタ・スカラ両輪論に異議を唱えてきているのであるが、歴史的にはアーキテクチャの議論はアーキテクチャそのものに対する議論では結論が出ないことが多く、結局、売れた方が勝という経緯をたどってきているので、今回も、コスト面での議論を、前面に押し出して、SX不要論を展開してきたのである。
 ただし、この不要論は、SXを悪者扱いする意図は全くないし、民間企業として世界で商売が成り立つのであれば立派なものと考えているし、過去のSXの業績の素晴らしさを否定するものでもない。
 こうしたヴェクタ機不要論とは全く関係なく、今回の文科省・理研側のNEC撤退の賠償請求騒動は、筆者の目からは、文科省・理研側が、自己の責任をほお被りして、自分だけ「良い子」になり、NECに全責任を押し付けているような、極めて悪質な、「いけにえ」作戦のようにしか見えないのである。
 文科省・理研は「言い逃れ」でなく、自己の下した判断に責任を負うべきであり、副大臣は、省内取り巻きの身びいきな意見だけに基づくことなく、広く外部の意見も聴取の上、公平な判断をするべきである。
 

  
Posted by petaflops at 11:45Comments(0)TrackBack(0) スパコン仕分け | スパコン 04

2010年07月10日

スパコン漫遊日記 2010-  目次(3)

目次の目次
         スパコン漫遊日記 2010-              目次(3)
         スパコン漫遊日記 2008-2009 CNET掲載分 目次(2)
         スパコン漫遊日記 2007-2008 CNET掲載分 目次(1

スパコン仕分
2010/8/6   理研のNECに対する損害賠償調停申立

TOP500
 Report
2010/6/1  スパコンTop500 2010-06、国別シェア他

GRAPE-DR
2010/7/10 GRAPE-DRの発表や報道に騙されてはいけない
  
Posted by petaflops at 23:21Comments(0)TrackBack(0) 目次 

GRAPE-DRの発表や報道に騙されてはいけない

 2010年7月6日、東大は、東大と国立天文台の共同開発したGRAPE-DRがLittle Green500でTop1になった旨研究成果発表を行った。
(7月10日現在、7月6日の東大の研究成果発表記事はPDF-fileは壊れていますとのメッセージが出て、表示されない様です。)

 GRAPE-DRは既に失敗プロジェクトとして結論が出ており、加えて、時期的にも、高性能GPGPUがいくつも市販されている現在では、存在価値を見出すことが難しいガラパゴス・ボードである。従って、これに時間を費やす事は無駄以外の何者でもないが、東大の発表の仕方、メディアの報道の仕方には、問題が多いと思うので、若干のコメントを記しておきたい。


 今回の発表は3つの意味で、ミス・リーディングな発表である。加えて、このミス・リーディングな発表を、何の継続的情報チェックもせずに、垂れ流し報道する日本のメディアは、その見識を疑わせるにたる低俗なものとしか判断しようが無いと感じている。

 ミス・リーディングな第1の点は、発表文中の[研究成果の意義]で、これは論点を発散させるための煙幕である。自己に都合の悪い、本来の税金プロジェクトとしてのプロジェクト目標がどの様な悲惨な結果になってしまったのかは全く公表せず、自己に都合の良い、本来の目標ではない話題を述べているわけで、本末転倒としかいいようのない、「目くらまし」発表なのである。
 自分達に都合の悪いものであれ、税金で給与を食み、税金でプロジェクトをやらせてもらっている身であることを自覚していれば、本来のプロジェクト目標に対する2008年レベルでの「けじめ」発表は、今回の発表以上に大々的に行われていなければならないものである。
 要するに、今回の発表は、失敗プロジェクトを、あたかも大成功プロジェクトであるかの様に「すり替える」ための印象操作的発表ということなのである。

 第2の点は、Little Green 500というマイナーなリストを、あたかも、公式のメジャーなGreen 500と同じであるかのような印象操作を行っている事である。
 Littleという形容詞がついているように、前者は極めて小規模なシステムも対象にしてあげましょうという、参考データで、Top500から転げ落ちた過去のSmall Systemも、1年半(18ヶ月)前までにTop500に入っていたSystemであれば含めてみましょうという参考リストにすぎない。
 余りにSystem規模の落差が大きくなりすぎると、性能的に公平ないしは有意味な比較とは考え難くなってしまうので、あくまで参考データという事なのである。一般的には、Small Systemの方が断然有利と考えられるからである。

 GRAPE-DRは22Tflopsとか23Tflops程度のシステムであり2010年6月のTop500ではランク落ちとなっている。一方Top1は1759Tflopsであり、Top10でも433Tflopsである。規模の違いは、19~76倍に及んでおり、こうした規模の違うシステムの消費電力を比較することに意味があるとは思えないわけである。
 問題サイズの規模の違いから来る、必要なメモリやPeripheral やInterconnect機器などの、capacityの差の問題や、最近では空冷vs液冷の問題など、物理的に様々な違いがあり、また、測定の仕方も、実測をするのであれば、小システムの方が自由度が高く圧倒的に有利であることは確かであろう。
 まあ、筆者は、Green500は「無いよりは良い」程度の参考データとしか考えていないし、多分、国際常識的にも、その程度の参考データとしか考えていないはずで、ダントツのブッチギリであればともかく、どんぐりの背比べ程度では、目くじらを上げて、「カッペ」丸出しに「世界一」「世界一」などと騒ぐほどのものではないと思っている。 
 本来Green500は、Top500にリストアップされた大型システムの消費電力の増大化に、競争的かつVisibleな歯止めをかけるための仕組みのようなもので、なんといっても関心は、Top10クラスの超大型システムに関するものである。Bottom近辺の演算性能でGreen Top1といわれても、「それで?」といった反応しか出てこない。

 で、この第2の点の本質は、こうした背景説明なしで、「世界一」「世界一」と騒ぐ発表者の「小賢しさ」と、その発表を無批判に受け入れ、「オオム返し」に報道する、メディアの「低能さ」、「低劣さ」なのである。こうした日本のメデイアの「低能さ」「低劣さ」が、国際社会の中で全く役に立たない、内弁慶な「日本国内だけでの世界一=ガラパゴス化」を助長・増幅しているわけで、この手の話は、昨年末の次世代スパコンに関する事業仕分けでの混乱報道と同根の問題で、日本のメディアの根深い問題といえるのである。

 第3の点は、「成果の意義」の中で、あたかも、GRAPE-DRが省電力設計技術を推進実現したかの様に表現しているのであるが、それは全くの作り話で、実際には、公表していた設計目標クロックでの作動を確立できなかったために、偶然思いがけず現在の消費電力になったということで、話が出鱈目である。
 本来、GRAPE-DRのクロックの設計目標は500Mhzであったが、正常作動させることができず、2008年のボード売出しでは380MHz、2009年6月のTop500へのエントリでは、なんと330Mhzでしか作動しなかったわけである。
 今回のクロックがいくらであるか、Top500にランクインしていないので不明であるが、チップの演算性能が100%クロック増加率に比例したとしても、消費電力の増加は概ねクロック増加率の2乗と考えられるので、本来の設計値である500MHzで作動させると、Flops/Wは今の値よりかなり悪くなるわけで、要するに、意図して世界一の省電力設計技術を実現したなどというのは、作り話も甚だしく、たまたま偶然そーなった程度の、「いい加減なもの」でしかないのである。
 つまり、こうした「いい加減な実情」を十分知った上で、状況を知らない一般人には、「省電力設計技術を推進実現した」かのように「成果の意義」として強調するなどというのは、受け取り様によっては、ある種の学術成果「詐欺」のようなものではないかと思わざるを得ないものなのである。

以上、GRAPE-DRのLittle Green 500に関する感想を述べたが、そもそもGRAPE-DRは、アーキテクチャーがチンケで、信頼性やデバッガビリティの作りこみも定かでない「素人のお遊び」であるので、必要ゲート数は商業製品に比べかなり少ないものと考えられ、Flops/Wでは有利であろうことは想像に難くない。
 問題は、このような「お遊び品」と「商業製品」を比べることの有意性であり、「お遊び品」 を持ち上げる事が、実は、とりもなおさず、日本をガラパゴスのがけっぷちに追いやり、貶めているのだということを理解できていない日本のメディアの低劣さである。こうしたメディアの低劣さが、善良な一般人を、訳の判らない感情的科学国粋主義に向かわせるわけで、その罪は極めて重いと思っている。

 なお、海外メディアとしては、HPCwireが伝えているようであるが、実はこの記事はHPCwireのNative記事ではなく、日本の日経BPが記事を書き、英訳したものの転載なので、海外メディアが興味を持って自主的に書いた記事というわけではない。「世界一」などと騒いでいるのは、日本の国内だけであろう。

  
Posted by petaflops at 23:07Comments(0)TrackBack(0) GRAPE-DR 

2010年06月01日

スパコンTop500 2010-06、国別シェア他

 2010年5月31日、ドイツのHAMBURGで行われているISC10で2010年6月のSupercomputer Top500が発表された。
 「ISC」は毎年概ね6月にドイツで開催されている大会で、米国勢は11月に米国で開催される「SC」に焦点を合わせているため、例年、6月の発表は上位の順位変動の少ない発表である。
 今回の新規ランクインは第2位の中国の深センSC(スーパーコンピュータセンタ)1機で、残りの順位変動は既存機の補強で、6位のNASA/Amesは前回5位の天津SCの天河を抜き、10位のSNL(Sandia研)は前回10位のTACCのRangerを抜いてランクインしている。


2010-June Top10順位             Linpack  理論    効率
                               Tflops
1 ORNL Cray XT5 Opteron        1759.0  2331.0  75.5%
2 深圳SC 曙光 
   IntelX5650+nVIDIA TeslaC2050  1271.0 2984.3  42.6%
3 LANL Roadrunner CelL+Opteron   1042.0 1375.8  75.7%
4 テネシー大 Kraken Cray XT5       831.7  1028.9  80.8%
5 ユーリッヒSC BlueGene/P          825.5  1002.7  82.3%
6 NASA/Ames Pleiades SGI Altix ICE 772.7  973.3   79.4%
7 天津SC 天河 
   Intel E5540+Radeon HD4800     563.1  1206.2  46.7%
8 LLNL Blue Gene                478.2  596.4  80.2%
9 ANL Blue Gene/P               458.6  557.1  82.3%
10 SNL Sun Blade Xeon X55xx      433.5  497.4   87.2%

 

 

 国別Top10では、総性能ベースで、中国が深センSCの1.27Pflops効いて第2位に躍進し、日本は6位で中国の4割程度までに落ち込んでしまっている。
 台数ベースでは、米(282)英(38)仏(27)中(24)独(24)日(18)の順であるが、英仏は小振りなものが多く、日本は18台と下落傾向に歯止めが掛かっていない。11月に向けての上昇要因としては東工大のTsubame2.0などが考えられるが、米国勢もPower7 Blue WatersやCrayのXT6など有力機が目白押しで、状況はかなり深刻である。
 上記以外ではスウェーデンが8位に入り、サウジが11位に落ちた以外は概ね前回と同じである。

国別順位

 国名      Tflops  シェア    台数 台数シェア
1 米      17,969 55.40%   282 56.40%
2 中      2,993  9.23%    24  4.80%
3 独      2,248  6.93%    24  4.80%
4 英      1,785  5.50%    38  7.60%
5 仏      1,707  5.26%    27  5.40%
6 日      1,253  3.86%    18  3.60% 
7 露       815  2.51%     11  2.20%
8 スウェーデン 416  1.28%     8  1.60%
9 カナダ     404  1.25%     7  1.40%
10 スイス    347  1.07%      5  1.00%



日本のランクイン機種

順位          Linpack   理論
             Tflops    Tfops
22 原研(JAEA)   191.4   200.08
37 海洋研       122.4    131.07
42 宇航研(JAXA)  110.6   121.28
53 東大センタ     101.7   138.96
56 理研        97.94   106.04
64 東工大       87.01   163.19
71 筑波大       77.28   95.39
91 核融合研      56.65   77
96 東大ゲノム研    54.21  69.12
107 気象研       51.21  72.79
111 京都大       50.51  61.24
137 電力研       42.69  45.88
138 物性研      42.69  45.88
189 民間(自動車)  37.39  48.86
229 民間(プロバイダ)34.65  65.43
230 民間(プロバイダ)34.65  65.43
301 統計研      31.18  33.75
383 名古屋大     28.51  30.97
500(参考)        24.67  54.79

 

  
Posted by petaflops at 11:46Comments(0)TrackBack(0) Top500 Report