2010年11月28日

Green500騒動

 2010年11月24日、NikkeiBP社のTech-Onに ”スパコンの「省エネ性能」ランキングはIBM社が1位,集計データの不具合で日本勢には「幻の2位」も” という記事が載っていた。この記事は11月26日の日経新聞にも転載されていた。

 記事の主旨は「2010年11月度のGreen500の番付には誤りがあり、GRAPE-DRが第2位になるべきであるのに、未だに修正がなされていない」といったようなものである。


 確かに、事務処理上の手違いがあるのなら、早急に修正をすることが望ましいことはいうまでもない。

 ただし、記事の内容は、GRAPE-DR側だけの主張を根拠にしている様なので、Green500側の説明を待つ必要もあろうかと思う。
 Green500はTop500とは別のグループなので、現在のところでは、Top500が修正されたからといってGreen500が自動的に修正されねばならないというものではない。


 Green500もTop500も基本的には「同好の有志」によるボランタリ・ベースのリスト作成であり、参加者の良識と協力を前提にしているので、不具合をあげつらうより、締切り直前に訂正を連発するなどして、彼らがミスを起こしやすい状況を作らないように協力することが肝心であろう。
 

 Green500に関しては以前から指摘しているように、常識的に考えて、Interconnectが小さくて済む小システムの方が大システムより有利であるし、また、チップに関しても、高い可用性/信頼性や広範な機能を要求される汎用チップより、機能を絞った限定用途チップの方が電力演算効率上は有利である。
 また、計測においても電力量を調整する試みがしやすい小システムの方が有利であることも言うまでもない。
 そして、それらを捨象した単細胞的な順位付けは、場合によっては、誤ったメッセージを発信することにもなりかねないわけで、このあたりは、大いに検討すべき課題であろう。
  
 Green500は、まだ始まって3年ほどの歴史の浅い順位付けリストであり、検討課題の多いリストであることを認識したうえで、無いよりはましな参考程度のものとして、読者に誤解を与えないよう留意して報道すべきでものと思う。

 

<Green500が「予算規模より技術で比較」というのは可笑しな話>

 
 日経BPの当該記事のセクション見出しには「予算規模より技術で比較」という部分があり、「システムの規模,つまりは予算の規模が物をいうTOP500と異なり,Green500は技術の高さがよりストレートに反映されやすいランキングだといえる。」と解説しているが、これは可笑しな解説である。

 
 今回のTop500、Green500で明らかになったことは、「総演算性能が予算にはリンクしていない」という事である。第1位のTianhe-1Aや第3位のNabulaeは円換算で70-80億円程度と推定されており、第4位のTsubame2.0も4年のリース総額が32億円程度ということで、スパコンの調達価格がこれまでの常識では考えられないほど安価になったわけで、これはGPGPUの価格性能比によるところが大で、まさに、Top500にこそ価格を含めた技術の差がストレートに反映されることを示している。
   
 というより、総合的技術力の表出である今日のスパコンの技術的評価には、演算性能や消費電力だけでなく、設置面積(容積)、可用性、信頼性、保守性、価格など多方面にわたる評価が必要で、本来は、こうした各項目に対しての明示的な評価がなされる必要があるのである。しかし実際上は、歴史のある演算性能のTop500と、地球温暖化防止・省エネなどの世界的流れに載った電力効率のGreen500がメディアの注目を受けているのではあるが、決して電力効率に「技術の高さがよりストレートに反映される」わけでないことは言うまでもない。

  
 電力効率だけを追及するのなら、たとえば、Programabilityの機能レベルや、演算性能に直接関係しない可用性/信頼性、接続性などの機能レベルを落とし、その分を演算回路に廻せば、Green500向けの見かけ上の電力演算効率は上がることになる。

 しかし、反面、Production Systemとしては、汎用機の機能としての、適用範囲の広さや、Production Run環境下での長期間連続使用の耐久力などは、本質的機能であり、これらの機能低下は弊害の方が大きいわけで、単純により多くの演算能力だけを取るのか、目に見えない縁の下の力持ち機能を取るのかは、技術力の問題ではなく、要求仕様の問題ということになる。

 また、前述のように、電力測定の方法論による可能性も大いにある。

 従って、単純に「Green500は技術の高さがよりストレートに反映されやすい」というわけではないことは自明であろう。

 


<GRAPE-DRは既に終わった話>


 今回の発端はGRAPE-DRの事らしいが、率直なところ、Grape-DRは、Green500で一位になろうと二位になろうと、”So what"、世界のスパコン業界には関係ない、もう終わった話ということである。技術的に国内外のメーカーがGRAPE-DRから取り入れなければならないような省エネ技術は無いだろうということである。

 要するに、ボードの価格や性能やサイズ、PCへの装着形態とパッケージング、ラック性能、拡張可能なシステム・サイズ、設置面積、可用性/信頼性、保守性、等々に加え、ソフトウェア・サポートのレベルやボードの後継プラン、等々の将来性なども含めて、nVIDIAやATIのGPGPUとは余りに差がありすぎ、もう終わっているということなのである。


 端的に言うと、下の写真1と写真2を見れば一目瞭然、写真1全体での性能が写真2の1ラックの性能といい勝負という事で、そもそも考えている品質レベルが全く違うということで、いくら電力効率が良かったとしても、世界の研究者が調達したくなるようなレベルのものではなく、市販のGPGPUで手軽に事足りるうえ、GPGPUには一応Follow-on Planもあり安心と言うことである。

 従って、GRAPE-DRは終わった話としかいいようがなく、まあ、今回のGreen500の件は、敗戦処理の一環の作業ということであろう。


Grape-dr-itechdiary-com









写真1 GRAPE-DR (NikkeiBP 2010-Jul-8) 
http://techon.nikkeibp.co.jp/english/NEWS_EN/20100708/184077/

Tsubame2












        写真2 Tsubame2.0

  

Posted by petaflops at 22:20Comments(0)TrackBack(0) Top500 Report | GRAPE-DR

2010年11月19日

Green500 2010-11 (参考速報版)

2010年11月18日、SC10で2010-11度のGreen500が発表された。速報値として参考までに、Top10のリストを載せてみる。

======================================
*追加訂正)2010/11/20
Green500のサイトにlistが掲載され、速報版の10位に変更がありましたので訂正しました。
第10位に日本の国立環境研究所が入り、中国のTianhe-1Aは第11位になりました。
また、Mflops値にも若干の誤差があり訂正しました。
======================================



Green500  2010-11
----------------------------------------------------------------------------
Rank    Site                         Linpack Perf.      Megaflops per watt   (#GPUs)
---------------------------------------------------------------------------- 
1  IBM Research (BG/Q)          65.3Teraflops       1684 Mflops/watt  
---------------------------------------------------------------------------- 
2  Tokyo Tech (Tsubame2)    1,192 Teraflops        958 Mflops/watt  (4200)
    GSIC Center
---------------------------------------------------------------------------- 
3  NCSA                                 33.6Teraflops        933 Mflops/watt    (128)   
---------------------------------------------------------------------------- 
4  RIKEN AICS (京)                   58 Teraflops          829 Mflops/watt
---------------------------------------------------------------------------- 
5  Forschungszentrum              45 Teraflops          773 Mflops/watt
    Juelich
---------------------------------------------------------------------------- 
6  Universitaet Regensburg        45 Teraflops          773 Mflops/watt
---------------------------------------------------------------------------- 
7  Universitaet Wuppertal          45 Teraflops          773 Mflops/watt
---------------------------------------------------------------------------- 
8  Universitaet Frankfurt           94 Teraflops           741 Mflops/watt
---------------------------------------------------------------------------- 
9  Georgia Institute of              64 Teraflops           677 Mflops/watt  (360)
     Technology
----------------------------------------------------------------------------
10 NIES Japan(国立環境研究所)    74.8 Teraflops         636 Mflops/watt  
     (top500/103位参照)
---------------------------------------------------------------------------
11 NSC Tianjin (Tianhe-1A)     2,507 Teraflops         635 Mflops/watt (7168)      
----------------------------------------------------------------------------


このデータを見ると、第2位のTsubame2と第11位のTianhe-1A以外は、100Tflops以下の小振りな実験機のようなものであるので、いわゆる、運用が開始されている本格的大型システムそのものとしての電力効率という観点で考えた場合、Tsubame2とTianhe-1Aのデータは大変意味があるように思う。 この意味でTsubame2は2010年度の実質Green500の第1位と考えてよいと思う。

2012年の先食い実験的データとして、第1位のBG/Qと第4位の「京」のデータは、どちらも最終的には20Pflopsとか10Pflopsといった巨大システムを目指しているわけで、今後の動向が注目される。
TubameやTianheのGPGPUタイプに対して、BG/Qや京はCPU‐Onlyタイプのシステムなので、来年現れるSandy-bridgeを含めて、アーキテクチャ的にも動向が注目される。

第3位のNCSAの機械はTop500の第402位にランクされているシステムで、Tsubameと同じようなXeonとteslaによるもので、Selfmadeとなっており、この程度の規模の機械は、大学で自主製作可能である事を示している。
  
Posted by petaflops at 06:31Comments(0)TrackBack(0) Top500 Report 

2010年11月15日

スパコンTop500 2010-11、国別シェアなど

 2010年11月14日、アメリカのNew Orleansで行われているSC10で2010年11月のSupercomputer Top500が発表された。

<2010-11 SC10 Top10>

順位       Site & System                 Linpack    理論性能  効率    消費電力  
                                  TF       TF            MW
1 <Tianhe-1A> 中国 NUDT in Tianjin            2566.0     4701.0  54.6%    4.04
    X5670 2.93Ghz NVIDIA C2050           
2 <Jaguar> 米 ORNL、                             1759.0    2331.0  75.5%    6.95
     Cray XT5-HE Opteron 6-core 2.6G             
3 <Nabulae> 中国 Shenzhen SC、                 1271.0    2984.3  42.6%    2.55
    Dawning TC3600, X5650, NVIDIA C2050             
4 <Tsubame2.0> 日本 東工大                 1192.0    2287.6  52.1%   1.34
       HP SL390s X5670, Nvidia C2050
5 <Hopper> 米 LBNL/NERSC                       1054.0    1288.6  81.8%    2.93
       Cray XE6 opteron 12core 2.1 GHz      
6 Energy and Atomic Commission(CEA)  仏     1050.0     1254.6  83.7%   
      Bull S6010/S6030、Xeon    
7 <Roadrunner>  米 LANL                           1042.0    1375.8  75.7%    
       IBM QS22/LS21, PowerXCell 8i           
8 <Kraken>  米 U‐Tennessee                       831.7    1028.9  80.8%    
        Cray XT5-HE Opteron 6-core 2.6 GHz   
9 Forschungszentrum Juelich (FZJ) 独        825.5    1002.7  82.3%    
        IBM Blue Gene/P 
10<Cielo> 米 LANL/SNL                       816.6    1028.7  79.4%    
 
       Cray XE6 Opteron 8core 2.4 GHz

 今回の話題はnVIDIA-Tesla(C/M2050) GPGPUの台頭で、第1位のNUDT(国立防衛技術大学)のTianhe-1A、第3位の深センSCのNabulae、第4位の東工大Tsubame2.0など、Top5の3システムがnVIDIA-Teslaを使ったCPU+GPGPUタイプのスパコンであったことである。そして、3システムとも東アジアに設置されたもので、世界のスパコン勢力図の重心がほんの少しだけ東アジアに移ったことを示している。

 ただし、これら台頭の基本的テクノロジーは米国製であり、また、来年になると、今回は間に合わなかった、NCSAのBlue Waters(10Pflops Power7)やLLNLのSequoia(20Pflops Blue Gene/Q)、さらには、NASA AMESのPleiadis、ORNLのGPGPUを使ったJaguar後継機といったといった10~20Pflopsクラスの機械が目白押しなので、半年か一年でゆり戻しが起きる可能性は高い。

新規Top10入りは
第1位の中国のNUDTのTianhe-1A
第4位の東工大TSUBAME2.0
第5位の米LBNL/NERSC(バークレイ研のNERSC)のHopperでCray-XE6
第6位のフランスCEA-DAM(代替エネルギー・原子エネルギー委員会軍事応用部門)のBull社製Tera100
第10位のLANL/SNLのCray-XE6 Cielo
である。

 順位的には 7位までがPeta越えで、10位でも0.8PFlopsである。参考までに第500位は31.12Tflopsである.

 その他、気がついたことを以下に列挙する。

・Cray-XE6で第5位のLBNL/NERSCのHopperなどにはOpteronの12coreが使用されている。

・第114位にBG/Q Prototypeが載っており(実行65.35T,理論104.86T)、1680Mflops/Wというブッチギリの電力効率とのこと。たしかに、この値そのものはブッチギリでtsubameや苦節ウン年のgrapeなどの約2倍であるが、昨年2月頃の担当者のインタビュー記事では3000Mflops/wを目指しているとか言ってた記憶があるので、目標に比べると、まだ半分という事で、今後どうなるのか注目したい。

・Blue Waters Power7に関してはPrototypeもどきも見当たらず、ほんとに何も出すものがなかったようである。

・CPU+GPGPU方式の評価に関してはHPCCのデータをチェックする必要がある。

・Tsubame2の実行効率52.1%はTianhe-1Aの54.6%に肉薄しており、ノード3GPUでノード1GPUと大して変わらない性能を示したことは、価格面、電力消費、設置面積などでノード3GPUの方が遥かに有利なので、Tsubame方式が広まる可能性は高い。

・第170位に理研に納入された「京」のPrototypeがリストされており、実行48Tflops、理論52.2Tflopsとなっている。highlightのところにK-ComputerはBG/Qに次いで829Mflops/Wと書かれているので、CPUタイプのシステムとして京はかなりいい電力効率を示していると考えられる。ビジネスチャンスを失わないためには、BG/QとGPGPUとの間に挟まれての、迅速なコストを含む思い切ったアクションが必要であろう。

・ベンダ別シェアでは、IBMが200システムで40%、HPが158システムで31.6%、Cray5.4%、SGI4.4%、Dell4.0%

・PerformanceシェアではIBMが27.4%、Crayが19.1%、HPが15.6%




<2010-11 SC10   国別>

 
  国   Linpack  Share %  理論性能      台数  Share % 
           TF                       TF 
   
1 米   22309.9  51.1%   31500.9       275  55.00%   
2 中    5688.8  13.0%   11609.7           41    8.20%   
3 日    2903.7    6.7%    4605.2           26    5.20%   
4 仏    2874.9   6.6%    3639.7           26    5.20%   
5 独    2721.4   6.2%    3504.9           26    5.20%   
6 英    1519.6   3.5%    2200.0           24    4.80%   
7 韓     907.6   2.1%     1065.5             3    0.60%   
8 露     867.7   2.0%    1143.8           11    2.20%   
9 サウジ   437.4   1.0%    514.3             6    1.20%   
10 カナダ  422.4   1.0%    629.7              6    1.20%    
 Totals 43656.7          64613.7        500     

 演算性能ベースでは、米中日仏独英韓の順で、大まかに言うと、中国は米国の1/4程度、日本は米国の1/8、中国の1/2程度で、日仏独は団子状態、英国は団子の半分くらいといったところ。
 日中ともnVidiaの新規ペタコンの貢献度が高く、日本では東工大のTsubame2.0だけで、6月度の総和に近い数値が加算されており、その他、ヴェクタ機離れで国際基準に近くなりつつある調達コストの効果も出始めているようで、6月度比で約230%の増加である。
 ただし、既にdismountされたはずのTsubame1.2がカウントされていたりして、Top500の精度に関しては若干の疑問符が付く。
 第7位の韓国は韓国気象庁が導入したCray-XE6 2セット(実行合計約633Tflops)の効果である。

 台数ベースでは、米(282=>275)中(24=>41)日(18=>26)独(24=>26)仏(27=>26)英(38=>24)の順である。日本はやっと台数下落の傾向に歯止めが掛かってきたような気配であり、ヴェクタ機の呪縛から逃れる事で、現状の予算のままでも、調達コストを見直すだけで、かなりの改善が図られるものと思う。

 日本は国家のスパコン予算規模的には、演算性能ベースにしろ、台数ベースにしろ、当然、米国に次ぐポジションを占めるべき国であり、徐々にではあるが、回復軌道に戻りつつあることは御同慶の至りである。

 中国の台数分布は100位以内に5件、100位以下に36件がランクインしている。100位以内では3件が国のスパコンセンター、2件が科学院に属するもの。製造は、1位のTianheはNUDTとなっており、第3位のNabulaeと35位の上海SCはDawning、28位の科学院のMole8.5はIPE+nVIDIA+Tyan(台湾?)、68位の科学院の他の1件はLenovoとなっている。
 100位以下の36件は殆どがエンジニアリング会社、テレコム会社、ネットワーク会社、サービスプロバイダ、インターネットなどとなっており、大学は2件である。製造会社はIBMが30件で、次いでHPが5件、残りの1件がInspurとなっている。
 100位以内の大型と100位以下との区別が余りにもはっきりしているので、驚いているし、またIBMが中国でこれほど強いというのも驚きである。
 
 

<2010-11 SC10 日本のTop500ランクイン・システム>

Top
500
順位   Site&System                   Linpack 理論性能
                                   TF    TF
  
4 東工大Tsubame2.0 HP SL390s X5670, Nvidia   1192.0  2287.6    
    NEC/HP     
33 原子力研 BX900 X5570 2.93G                      191.4  200.1    
    Fujitsu     
42 東大物性研 SGI ICE 8400EX                        161.8  180.0    
    SGI     
54 海洋研機構 SX-9/E/1280M160                     122.4  131.1    
    NEC     
59 JAXA Fujitsu FX1, SPARC64 VII                  110.6  121.3    
    Fujitsu     
70 東大 情技センタ Hitachi opteron QC 2.3G       101.7  139.0     
     Hitachi     
74 理研 Xeon X5570 2.93GHz                           97.9  106.0    
     Fujitsu     
88 東工大Tsubame1.2 Sun Fire x4600/x6250        87.0  163.2    
     NEC/Sun     
95 筑波大 計科センタ Appro Xtreme-X3                77.3   95.4    
     Appro International     
103 環境研 Asterism ID318, Xeon+NVIDIA            74.8  177.1    
      NSSOL / SGI Japan     
131 核融合研(NIFS) Hitachi SR16000 Power6         56.7  77.0     
       Hitachi     
134 Service Provider xSeries x3650M2, Xeon        55.9  105.6    
      IBM     
138 東大 ゲノムセンタ SunBlade x6250, Xeon          54.2  69.1    
      Oracle     
153 気象研 (MRI) Hitachi SR16000 Power6           51.2  72.8    
      Hitachi     
158 京大 センター Fujitsu HX600 Opteron               50.5  61.2    
      Fujitsu     
170 理研 先進計算科学研 「京」, SPARC64VIIIfx         48.0  52.2    
      Fujitsu     
219 電力中研 SGI ICE 8200EX, Xeon                     42.7  45.9    
     SGI     
220 物質材料研機構(NIMS) SGI ICE 8200EX, Xeon    42.7  45.9    
      SGI     
279 国立天文台 GRAPE-DR accelerator                   38.9  81.9    
      Self-made     
282 Financial Institution xSeries x3650M2 Xeon     38.8  75.3    
      IBM     
310 Automotive Company DL4x170h Xeon E5550    37.4  48.9    
      Hewlett-Packard     
377 東大 バイオ・医療 PRIMERGY BX922 S2,              34.7  37.8    
      Fujitsu     
378 Service Provider xSeries x3650M2, Xeon          34.7  65.4    
      IBM     
379 Service Provider xSeries x3650M2, Xeon          34.7  65.4    
      IBM     
383 国立天文台 GRAPE-DR accelerator                    34.6  66.4    
     Self-made     
494 統計研 PRIMERGY RX200S5                             31.2  33.8    
     Fujitsu     
     

  
Posted by petaflops at 16:01Comments(0)TrackBack(0) Top500 Report 

2010年11月05日

アゴラの記事「中国スパコンが世界一」に関して

 11月2日付けのアゴラに、山田肇さんという人の「中国スパコンが世界一」という記事が載っている。
http://agora-web.jp/archives/1118551.html

 内容を纏めると、中国のスパコンが世界一の性能を達成したことに関連して、11月1日の日経夕刊で(わが国の次世代機開発は)『国の威信をかけた事業です』と解説している記事や、10月30日の産経のNYTimes等米有力紙を引用した記事などは

・ 「これらの報道は感情に走っている。スパコンの性能が示すものについて基本的な誤解があるようだ」

と断定し、Top500のLinpackによる順位付けに対し

・ 「LINPACKは1970年代に開発されすでに時代遅れなのだが、物差しが代わると経年的な比較ができなくなるので、利用され続けているだけのものである。」

・ 「自動車レースのフォーミュラ1は直線路の最高速度だけで性能が評価できるだろうか。」

と、否定的意見を述べ、結論的に、

・ 「コンピュータ市場の中でスパコンの占める割合は小さい」から
・ 「世界一になったとしても市場への影響は限定的」で
・ 「市場の主戦場はクラウドコンピューティングである。この市場で日本企業に存在感がないことのほうが競争力としてはよほど大問題である。」

とし、

・ 「スパコンは科学技術の一分野に過ぎず、しかも(Linpackは)一側面での評価に過ぎないのだから、大騒ぎに意味は無い」

といったような主張である。
  
  
 始まりのNYTなどからの状況認識はヘンだし、Linpack性能や地球シミュレータ(ES)のオカシナ議論を経て、結論の部分で突然飛び出してくる取って付けたような目くらまし的「クラウド主戦場説」は、Linpack性能やスパコンとは全く関係ないもので、論理の飛躍以外の何者でもない。

 それが、Linpackや地球シミュレータなどに対する一連の誤解と共振して、筆者にとっては、何が言いたいの?そんなマーケットの事など始めからわかってることじゃない!といった読んでいて馬鹿馬鹿しい印象しか残らない記事であった。

 反論などするのは時間の無駄と思いつつも、彼の一連の誤解は、自分の屁理屈に合わせるための創作/捏造の類で、いわば、汚水の垂れ流しのようなもので、反論の必要を感じ、それが元で、いつの間にか、記事全般に対してもコメントを加える事になってしまった。


<NYT、WSJなどの記事は普通の分析>

 まず、NYTimesやWSJの記事から述べると、これらの記事はNYTやWSJの意見というより、Top500のco-autherであるUTKのJack DongarraとLBNLのSimon Horstや、VTのWu-chug Feng等へのインタヴューで記事を構成してるもので、彼らの冷静な分析をストーリーにしただけで、何処が「感情に走っている」のか全く理解できなかった。この人はオリジナルの記事を読んで書いているのか不安になってしまう。

 NYT、WSJの記事の内容は概ね以下のようなもので、特段、差し迫った感情的な緊迫感は感じられないし、どちらかというと、余裕の対応のように感じる。

・Tianhe-1Aは、IntelやnVIDIAの市販製品を、中国独自開発のInterconnect(Infiniband QDRの2倍の転送速度)で結合したもので、開発形態はCRAY社が行っているものと同じである。

・これは米国へのwake-up callのようなもの

・同程度の性能のものなら、USの顧客が作る事は可能である。

・日本は単発であったが、中国は長期的戦略で段階的に多くのスパコンを作ってきており、ゆくゆくは独自CPUを組み込んでくるから、長期的には脅威になる。

・こうした意味で米国が保持しているHPCでの優位性はリスクに面しており、米国の将来の経済基盤に打撃を与えるかもしれない。 

・(Tianhe-1AのCPU+GPGPUの方式は)アプリケーション・プログラムにより向き不向きがあり、全てにとって使いやすいわけではない。

・米国には、もっと速く使いやすいsystemの計画がある。



<Tianhe-1Aの影響>

 中国のスパコンTianhe-1Aに関して、現在、世間が大騒ぎしているとは思えないし、今後も大騒ぎは無いであろう。

 技術的には、Intel-HPとnVIDIAの市販品をくみあわせた東工大のTSUBAME2と殆ど同じであるから、70-80億円とスパコン部屋を用意すれば、半年も掛からずにNECとHPが作ってくれる程度のものである。

 マーケット的には、米国製市販品だけで済むものであるから、中国の影響などは考えられない。しかし、価格性能比、電力性能比などの観点からnVIDIAのTesla-GPUの存在感は著しく増加し、Teslaを組み込めるHPやDELLのサーバーによる小規模構成・低価格のSemiCloneが、研究室レヴェルでかなり多く導入されるものと予想され、HPC市場の裾野拡大には、かなりなインパクトがあるのではないかと予想している。
 


<地球シミュレータは汎用機>
 
 彼は地球シミュレータ(ES)が「地球規模の環境変動の解明・予測に最適化されたスパコン」などと言っているが、ESは、そもそも、JAXA、原研、海洋研の共同予算600億円で開発されたもので、設置場所を確保できた横浜の海洋研に設置されただけで、名称も設置場所に合わせておいたほうが予算獲得に便利程度のことであり、航空力学、原子力開発、などを含めた汎用機として開発したのであって、決して「環境変動に最適化」したものなどではない。

 そして後継機(概ね180億円くらい)の選定で、神戸の次世代スパコンを採用しなかったのは、単純に、更新時に、まだ次世代機は存在しなかったからで、SX-9になった理由は、入札にNEC以外参加が無かったからで、そのほか既存プログラムの大規模な書換・変更が無いことなども決め手の一つであったかと思う。

 次世代スパコンとの関連で述べれば、海洋研は次世代スパコンの開発主体に立候補したのであるが、ESの運用の仕方や巨額年間経費などで文科省や関連研究所の覚えが愛でたくなく、開発主体を理研に奪われてしまったのは周知の事実であり、この程度の経緯を押さえないで記事を書くと、一般の人はともかく、スパコン関連の人達からは馬鹿にされる事になる。

 ましてや、Vector機である現在のES後継機(ES2)が「環境変動専用機」であるかのごとき断定は、NECの撤退で崩壊してしまったが、「日本のスパコン戦略は専用機を作る戦略であった」などという頓珍漢な結論に至らしむわけで、笑うに笑えない誤解である。

 そして、ES、ES2の開発を行い、Vector機で次世代スパコン開発に参加していたNECが次世代スパコンから撤退した理由は、公式には「経営環境の悪化」であるが、現実には、国際市場でVector機は、価格性能比、電力性能比、設置面積性能比など、多くのパラメータで、市場競争力を失っていたことが本質的理由である。
 数年後のES2の更新時には、巨額財政赤字の下で、ES2と同等な予算が組めるとも思えず、また、Vector機はなくなってしまっているわけで、プログラムの大規模変更は必須となり、マーケットが存在しない山田流「環境専用機」は後継の選択で手痛いしっぺ返しを受けることになると思う。、
 


<コスト視点: 『国の威信をかけた事業』の現状と巨額税金支出の妥当性>
 
 山田さんは、「市場への影響」とか「市場競争力」などと述べながら、コスト視点を完璧に無視している。 

 今回の中国のTianhe-1Aが投げかけている問題は、単にLinpack性能だけの問題ではなく、開発調達費用が70億円強と推定されているほど安価であることや、市販部品が殆どで、開発期間が極めて短時間で済むことなど、価格性能比、電力性能比、設置面積性能比、部品調達の容易さを含む開発期間、などといったコスト関連の様々な論点が含まれている。
 国際市場では、Tflopsあたりの単価が急激に下がっているにも関わらず、旧態のまま親方日の丸で1150億円もの巨額税金を必要としている神戸の次世代スパコを含めた日本のスパコン戦略の妥当性と再検討の必要性を強く示唆しているという事なのであり、本来、国内で騒ぎが起きないことの方が問題なのである。

 幸いな事に、日本に於いても、中国のTianhe-1Aと殆ど同じシステムがこの11月から東工大で稼働しており、規模は1/2ほどであるが、様々なデータが蓄積されていると思うので、日本のスパコン戦略見直しの参考になるものと思う。


<Linpackに関する誤解: Linpack Benchmarkは、スパコンの必要条件>

 「Linpackは1970年代に開発されすでに時代遅れなのだが、物差しが変わると経年的な比較が出来なくなるので、利用され続けているだけのものである」とあるが、これは本末転倒の誤解以外の何者でもない。
 「経年比較の意味しかない」のであれば、今後は全て新しいBenchmarkを使用することとし、経年比較のためにLinpackを併用すればよいだけなので、ぜひとも、Linpackに代わる、「時代遅れで無い」Benchmarkを提示してもらいたいものである。
 
 これまでもLinpackは無意味だといったような主張がなされてきているが、今までのところ、Linpackに取って代わる新しいBenchmarkは提示されていない。
 要するに、Linpack時代遅れ論者などは、無いものねだりの駄々子で、自分に都合が悪くなると、物差しがおかしいと言い出すが、代わりの物差しは提示できない駄々子に過ぎないという事なのである。

 Linpackに代わる物差しの試みとしてHPCC9項目のBenchmarkがあるが、その主要4項目は、HPL(Linpack)、FFT(フーリエ変換)、EP‐Stream(データ移動)、Random Memory Accessなどである。これらの内で、統合された有意味な作業として性能評価の期待がもてるのはHPLとFFTであり、HPLの守備範囲から漏れているエリアをFFTでカバーするという考え方である。

 これは数値計算の方法論的にも有効なものである。というのは、微分方程式の近似解を求めるには、差分近似-Linpackか、フーリエ級数展開ーFFTが一般的であるからである。

 結局、HPCCというLinpackの代わりのBenchmarkに於いても、相変わらずLinpackは有力なBenchmarkであり、「Linpackは時代遅れ」などといった主張は、的外れという事なのである。

 従って、Linapck Benchmarkでの評価は、スパコンにとって必要条件であることは確かで、十分条件では無いが、スパコンの性能評価には今後とも必要であろう。

 

  
Posted by petaflops at 14:23Comments(0)TrackBack(0) スパコン 04