2010年10月28日

Tianhe-1A Linpack  2.507Pflops を達成

 2010年10月28日、HPCwireが伝えるところでは、中国国立国防技術大学(NUDT、National University of Defense Technology)の Tianhe-1A はLinpackで 2.507Pflops を達成し、現在のところ世界第1位になったということである。
 このHPCwireの記事は、「現在のところ(today)」という語を挿入しており、11月のSC10でのTop500発表までの暫定といったニュアンスをにじませているので、Top500での第1位が決定したという断定にはなっていない。

 2004年の11月のときは、10月にIBMがBlueGene/Lで地球シミュレータを越したと発表した後に、NASAのSGIのAltix3600によるColumbiaが、そのBlue Gene/Lの値を抜いたと発表したので、皆がNASA Columbiaの第1位は決まりと思っていたところ、IBMはBlue Gene/Lを増強し、11月に入ってからColumbiaを抜き返したと発表し、そのままTop500ではBlue Gene/Lが第1位を確保した、といった過去の例があるため、この時期は結構言葉選びに気を使っているのではないかと思う。

 まあ、過去の例はともかく、今回見えてこないのはNCSAのBlue Watersのデータで、昨年のSC09での超デカ・ボード展示から1年たつので、問題が無ければ、何らかの進捗はあってしかるべきと思うので、どうなっているのかが知りたいところではある。

 Tianhe-1Aに関しては、先のExaScaleのMeetingでの中国科学院のプレゼンよりは若干詳細になり、Tesla M2050を7168台使用し、CPUは14,336台となっているので、1ノード=2CPU+1GPU という組み合わせの様である。電力消費は4.04MW。

 Tianhe-1から1Aへのupgradeで、CPUやBoardの詳細は不明であるが、GPUはATIのRadeonからnVIDIAのTesla M2050に変更になったようである。 とりあえず、CPUはTSUBAME2.0と同等と仮定して、実行性能比を計算してみる。

理論性能
CPU 14,336台 1.100Pflops
GPU  7168台 3.691Pflops
合計         4.791Pflops

Linpack実行値  2.507Pflops

実行性能比     52.33%

中国科学院のプレゼンを元にした実行効率は40%程度であったが、今回のデータからは、Tianhe-1Aは、そこそこの実行性能比を示しているといってよいと思う。

 

  

Posted by petaflops at 19:03Comments(0)TrackBack(0) スパコン 04 

2010年10月27日

ArgonneのCray-XE6 と Stuttgart HLRSのCray-XE6など

<Argonne Beagle>

 2010年10月21日、米Argonne研究所のComputation Institute(CI)はBiomedical分野用のスパコンとして、Cray-XE6(150Tflops,18,000core、ニックネームBeagle)の導入を発表した。設置は1Q/2011である。契約額は公表されていないが、予想としては$5M前後ではないかと思っている。

 Argonne研はイリノイのシカゴ近郊にあり、組織的にはエネルギー省傘下の組織であるが、核開発関連のNNSA傘下の御三家研究所(LANL、LLNL、Sandia)とは別のOffice of Science(OS)傘下の大変大きな研究所で、研究分野も科学全般の多岐にわたっている。
 Argonne研の始まりは、マンハッタン計画に直にリンクしていたシカゴ大の冶金研究所で、核開発の名前を隠すためウランを取り出すような冶金の研究機関としたものである。当時、役に立つのかどうかわからなかった核研究に多額の予算措置を行うことは不可能であり、ドイツや日本への情報漏れを防ぐ意味もあり、別の機関などでは代替エネルギー研究などの名目も使われていた。当時の所長は、Compton効果の発見で、米国で最初にノーベル物理学賞を受けたArthur Comptonで、彼の庇護の下、ノーベル賞授賞式から直接米国へ亡命してきたイタリアのEnrico Fermiが中心となって核分裂の基礎研究を行った由緒のある研究所である。

 ArgonneのCI には幾つかの施設があり、その中の1つはAlgonne Leadership Computing Facility(ALCF)で、2010-June版Top500で第9位の0.5PflopsクラスのBG/P(Intrepit)が設置されている。CIにはBlue Geneコンソーシアムの事務局が置かれており、IBMのソフトには満足せず、自分達でOS等々を開発しているグループがいるなど活発な動きもあり、2012年には10Pflops版のBG/Q(Mira)がLLNLのSequoiaに続いて設置される予定になっている。

 今回、Cray-XE6の導入が決まったのは、Initiative in Biomedical Informatics(iBi)という、Blue GeneのALCFとは別の施設で、ニックネームのBeagleはCharles Darwinが乗っていた船の名前から命名されたものということである。


<Stuttgart HLRS>

 2010年10月26日、Cray社はドイツのStuttgart大のHLRS(The High Performance computing Center, Stuttgart)から複数年複数フェーズで総額$60Mのスパコン設置契約を受注したと発表した。内容的には、2011年にXE6を納入し、2013年後半にCrayの次世代スパコン、開発名Cascade、を設置するということである。性能に関する記述は公表されていない。
 
 Cascadeは、DARPAのHPCS programに於いて ”Adaptive Computing(Heterogenious Computing)" を実現するペタコンとして$250Mで受注したBig Projectであるが、Vector 処理の部分が不調で、昨年暮れ、DARPAとの間で契約見直しの騒動を起こしていたProjectである。

 見直しの具体的内容は承知していないが、今回のHLRSの発表を見ると、2013年にIntelの次世代CPU(多分Sandy-Bridge)を使ってCascadeを納品するとなっているので、機能的には、DARPA向けCrayのAdaptive Computing(Cascade)はIntelの次世代CPU(多分Sandy-Bridge)で実現するということと考えてよいと思う。
 という事は、Adaptive ComputingはCary独自の製品というより、Intelの普通のCPU製品ということなので、特段、Crayに拘ることなく、どのメーカーも製品を提供する事は可能という事になる。

 この見直しによりCrayは、金銭的には、かなりの減額を受けたようで、昨年度の決算は、このDARPAの見直し分が直に決算内容を大きく左右し、結果、小額ではあるが赤字となり、3年連続の赤字決算となってしまった。
 Cray Inc.は、従業員数約850人、年間売上げ約$280M(約220億円Y$80)程度の中小企業であるので、DARPAの契約額は年間売上額に相当し、複数年での売上としても、かなりな比重であったわけで、そのうちの$60M程度が減額された模様で、決算上はかなりな打撃であった訳である。
 多分今年も経営的には厳しい状況にある思えるので、2013年後半での手形を切ってのHLRSとの契約になったのではないかと思う。ここ数年、Crayはかなり綱渡り的経営が続いており、HPC業界は楽ではない。

 HLRSは、数少ないNEC SXのユーザとして、日本に於いては、有名であり、SX-8(1.2Tflops)、SX-9(19.2Tflops)を保持しており、Cluster(Scalar)系も IntelのX5560(Xeon Nehalem、2.8GHz、4core, 2socket)を使った62TflopsのNECのサーバーを導入しており、NEC Favorな研究所であった。
 しかし、同時に、Scalar系としてはCray-XT5m(8.5Tflops)も導入しており、今回のXE6とCascadeの契約につながったものと考えられ、2013年のCascadeを考えると、Vector機能はGPUを内蔵するSandy-Bridge系で置き換え、NECからは離れることになったものと思える。
 まあ、SXの後継の有無やコストを考えると、当面は、TSUBAME2.0のようなCPU+GPGPUタイプで置き換え、その後はSandy-BridgeのようなAVX内蔵系にしてゆくのが流れではないかと思う。

  
Posted by petaflops at 22:04Comments(0)TrackBack(0) スパコン 04 

2010年10月25日

Tianhe、NebulaeのUpgrade情報とTSUBAME2.0

 2010年10月18-19日、ハワイのマウイで、International Exascale Software Project(IESP)の第5回目のMeetingが行われた。IESPは2009年から、一連のMeetingを Santa-Fe、Paris、Tsukuba、Oxfordで行ってきており、今回が第5回目という事になる。Exec. CommitteeにはJack Donngarraほか米欧日の大型スパコン保有組織からの10名ほどのメンツが顔を並べている。
 国際政治でのG8とか、金融財政のG7とかと同様、Top500での力関係から言うと、中国が抜けていることになり、今回、中国科学院のXue-Bin Chiが中国のスパコンの状況を ”The Developoment of HPC in China” としてBriefingし、そのPresentation DocがUpされていた。

 このDocの中で、NebulaeとTianheの状況が以下のように簡単に触れられている。

Dawning Nebulae
 - 600TFLOPS CPU + 3PFLOPS GPU
 - Top500 Rank 2nd
 - Budget 600M RMB
    * MOST 200M, Shenzhen Government 400M
 - Upgrade 1PFLOPS CPU,  200TFLOPS Godson
 
NUDT Tianhe
 - 200Tflops CPU + 1.2PFLOPS GPU
 - Top500 Rank 7th
 - Budget 600M RMB
    * MOST 200M, Tianjin Government 400M
 - Upgrade 1PFLOPS CPU + 4PFLOPS GPU
    * HPL 2PFOPS 
 
 この記述とMeeting 出席者からのTwitter情報により、TianheがUpgradeされ、HPLで2PFLOPSを達成したということになっているようである。確かに、Nebulaeに関してはUpgradeの記述はあるが、HPL等の具体的データは記述されていないのに対し、Tianheには具体的数値が示されており、それがもし目標値であれば出席者が耳で聞いていてその旨注意を喚起するであろうから、この数値は実行結果ということなのであろう。

 数値の精度に関しては、記述全体が、1桁、良くて2桁程度なので、大枠についてであろうと思うが、TianheがLinpack 2Pflopsを達成し、11月のTop500で、第1位になる可能性が高いということのように思える。 
 米国のメディアにおいても、Top500のデータ集積の親方衆の1人であるJack Dongarra氏も中国1位予想説を否定していないといった記事を読んだ記憶があるので、結構信憑性が高いのではないかと思う。
 となると、NCSAのBlueWatersがどうなっているのかは知りたいところであるが、厳しいかん口令を敷いているのか、あるいは、ほんとに出すデータがないのかは、ここ半月ほどで明らかになる。

 Upgraded Tianheの実行性能比は大雑把に、2Pflops/5Pflops=40%ということになるが、プレゼンの中ではUpgradeの内容に関して、何も触れていないので、詳細はわからない。
 GPUが従来のRadeon HD4870x2なのか、Tesla C2050に取替えたのかは不明であるし、CPUも従来のXeon E5540+E5450のままなのか、NebulaeのようにX5670等に変更したのかも不明である。 あるいはBoardメーカに関しても、NebulaeはDawning TC3600であるが、以前からTianheに関しては記述はなく、今回も情報は見当たらない。

 TianheのBoard構成に関しては、2009年11月のTop500サイトの中の記事に、E5540の計算ノードは2CPU 2GPUでメモリは32GBとなっていたので、GPU当りのメモリ量は余り潤沢とは思えない。NebulaeのTC3600に関しては2CPU 1GPUということらしいが、メモリサイズは不明である。

 こうしたメモリ量は実行性能に大きな影響を与えるものと考えられ、実行性能比が低い理由の一つとも考えられるが、如何せん、Original及びUpgradeの詳細内容が明らかでないので、余り有意味な議論は出来ないであろう。

(注1) 


<調達費用比較>
 
 上述の中国科学院のプレゼンで、筆者の興味を引いたのは、筆者の思考傾向からは当然であるが、調達費用の話である。Tianhe、Nebulae共に、600M元(RMB)となっており、 その内の200M元を国の科学技術省(MOST)が負担し、その倍の400M元をそれぞれ深センあるいは天津の地方政府が負担していることである。

 中国の税制の詳しいことは知らないので、これらのスパコンの地方負担ということのお金の流れ的な意味はピンと来ないが、日本は勿論、米国でも、多分欧州でも、基礎科学技術的なものは国の組織下で国の負担が一般的なような気がするので、受益者負担的に2/3 を地方政府に負担させるという方式は、西欧型社会では、所有権、管理権、使用権とかが絡んで結構めんどくさい事になるかも知れない気がした。

 さて、価格に関しては、プレゼンのデータはUpgrade前の調達費用と考えられるのだが、現在の為替レート、1元=12.2196円、1元=$0.150、を適用すると、600M元は約73.3億円、$90Mということになる。理論性能とLinpack実行性能およびLinpack実行性能のTflops単価は以下のようになる。

Tianhe-I <1206Tflops, 563Tflops、1302万円>
Nebulae <2984Tflops、1271Tflops、577万円>
TSUBAME2<2400Tflops、1200Tflops??、222万円??> (??は予想値)

 大雑把に言って、TianheもNebulaeも、GPUタイプのスパコンとしては、CPU鎮一タイプに比べコスト・アドヴァンテージがある様には見えない。どちらかと言うと、設置面積や電力消費のアドヴァンテージの方が大きいように見受けられる。残念ながら、UpgradeしたTianhe,Nebulaeに関してはデータがないので判断しようがない。
 これに対し、TSUBAME2.0はLinpackで概ね1.2Pflops以上が達成できれば、GPUタイプとしての設置面積、消費電力に加えコスト・アドヴァンテージもあるので、国際基準でいっても、結構良い線をいっているように思える。

 TSUBAME2.0が我々に投げかけている本質的問題は、我が日本国の、スパコンに対する基本戦略の問題であり、今時、たかが1台のスパコンのために1200億円もかかけることに何の意味があるのかという事なのであり、その他多くの国立研究機関でのコストに杜撰なスパコン調達に対する厳しい検証の必要性を訴えているのである。

 




***(注1)***

 注1の部分にあった、以下の記述は仕様の誤解釈でしたので削除しました。

< 因みにTSUBAME2.0はノード当り2CPU 3GPUであるが、メモリは52+96GBでGPU当り48GBのようなので、この辺りはTSUBAME1.2からの経験ではないかと思うが、1ノード3GPUのため苦労しているらしい事が見てとれる。>

 TSUBAME2.0のHPのHWの記述(http://tsubame.gsic.titech.ac.jp/hardware-architecture)を見ると、「54GB(一部96GB)」となっており、削除記述は5月頃の若干曖昧な記述を(贔屓目に)拡大解釈したための誤解釈でした。
 一部の96GBのノードを除いて、1GPUあたりのメモリは54/3で18BGと思えます。  (2010/11/02)

  
Posted by petaflops at 23:03Comments(0)TrackBack(0) スパコン 04 

2010年10月21日

TSUBAME2.0の落札公示

 2010年10月12日、文科省の調達情報サイトに、東工大のTSUBAME2.0の公式な落札公示が掲示された。 開札/落札は5月25日であったので、かなり遅い公示である。
 TSUBAME2.0の話題は、HPのサーバーproliant SL390sの発表に付随して、10月5日に、HPCwireとthe Registerが結構詳しく報道していたが、10月14日にもHPCwireはTSUBAME2.0の設置完了の記事を掲載しており、11月のSC10を目前に控えて、中国の競合機Tianhe(Peak 5Pflopas、Max2Pflopsにupgradeしたらしい)などとともに騒がしくなってきたようである。

 
<TSUBAME2.0の復習>

・ 本体:   HP proliant SL390s、
         X5670 (Westmere EP、2.93/3.196Ghz,52/96GB、2socket-153Gflops)
・ GPU:   nVIDIA M2050(Fermi、0.515Tflops)
・ node:   SL390s x1 + M2050 x3  (0.153+1.545=1.698Tflops)
・ rack:   32node (4.896+49.44=54.34Tflops )

・ Main System:       44Rack (1408node、4224GPU、2391.35Tflops)           
・ Additional Servers: HP 4socket server (Nehalem+TESLA) x 34node = 8.7Tflops         
・ Interconnect: Voltair QDR Infiniband、Topology=Full Bisection、BW=200Tera-bps
・ Storage:    SSD+HDD
・ Total Rack:  60、200m**2

・ Software:   "Linux-CentOS&MS Windows HPC" under "XEN for Multi-OS support"  
              on Top of Linux-SLES11


 TSUBAME2.0の理論上のシステム性能は2.4Pflops、Rack性能は54.34Tflops、node性能は1.698Tflopsである。

 TSUBAME2.0のLinpackの実行データは11月のSC10で公表されるであろうから、今この時点であれこれ詮索するのは無粋であるが、Linpack実行性能は、理論性能の半分程度の1.2~1.4Pflopsではないかと予想している。

 理由はTSUBAME1.0(ClearSpeed CSX600、57.7%)、TSUBAME1.2(CSX600+nVIDIA GT200、53.3%)や、中国のNEBULAE(nVIDIA C2050、42.6%)、TIANHE(ATI Radeon、47.1%)、MOLE-8.5(nVIDIA C2050、18.2%)などのアクセラレータ/GPGPU系の実績から、理論性能の50%前後が一つのメドであり、東工大はTSUBAME1.0、1.2の経験があるので、やや高めの60%に近い値も期待し得るのではないかと思うからである。

 類似した形式のものにIBMのPowerXcellを使ったRoadrunnerがあり、理論性能の75.7%を出しているが、PowerXcellは独立したCPUであり、アクセラレータやGPGPUとは若干異なるものと考えるべきであろう。

 TSUBAME2.0のRackの理論性能は54.34TflopsであるがLinpack換算では半分の27Tflops程度と考えると、文科省・理研のKのRack性能12Tflopsの2倍強であり、Capacity的にはLinpack換算で5-7Pflops程度のSystemを狙える能力である。

 蛇足ではあるが参考までに述べると、東大‐国立天文台の失敗作GRAPE-DRが2009年11月に達成したシステム全体の能力(Peak84.48Tflops、Linpack21.96Tflops)は、TSUBAME2.0の1Rack分程度のものと評価され、コストを含めた技術力の差というものをVisibleに見せてくれている。



<調達価格>

 さて、落札公示の話に戻ると、内容は以下である。

落札者:    日本電気
リース期間: 平成22年11月1日から平成26年10月31日まで (4年=48ヶ月)
月額料金:  ¥65,131,500円

 支払総額は31億2631万2千円ということになり、リース諸費用・金利などの加算分を15%と想定してノーマライズすると、
買取推定額は¥26億5736万5200円 という事になる。

 検算の意味で、市販部品などからのbottomup推定の方法で検証してみる。TSUBAME2.0でmainに使用するHP proliant SL390sとnVIDIA M2050の米国での単品の市販価格は、概ね、$7,000(Mem24GB)と$2,500程度と推定される。memoryの増強はMaxの12slot分として$2,400、InfBを$1,000と想定すると、1ノード3GPUなので、ノード単価は$17,900となり、総ノード数1408を計算すると、約$24Mとなり、円換算ではY$90とすると約22.7億円程度ということになる。
 この額から、製造会社のBulk直納であることやアカパックもどきを含めた大幅なDiscountを想定し、たとえば20%引きを想定すると、18億円程度になり、残りの8億円で、SSD、HDDや、システム管理+IO系のサーバー、interconnect関連装置、設置関連諸費用、NECの元受管理費等々を賄えばよいわけで、リース月額から導かれる買取推定額26.6億円は、まあまあ、大きくは外していない数値ではないかと思う。

 細かいことを気にする人は、付帯条件がどうのこうのと神経質になる傾向があるが、付帯条件などの詳細は落札公示には記述されておらず、細かい違いはあったとしても、そうした付帯条件は最終的には性能に収斂されるものと考えれば、大枠を知る上での障害にはならないと思う。そもそも、リース諸費用・金利なども期間やリース会社により結構違いがあり、ノーマライズの精度は高いわけではない。
 Globalな価格比較の大局を知るための、他の有力な方法が無い以上、末節に異論はあっても、この支払総額からのTflops単価は有効な指標であることは間違いないとおもっている。

 以上の結果から、TSUBAME2.0の推定Tflops単価は以下のようになる。

買取推定価格:        ¥26億5736万5200円
推定Tflops単価:       ¥111万円
補正推定Tflops単価:    ¥222万円  (GPU nodeの実行性能を50%と仮定)


 また、GPGPU使用のシステムはコスト的には安いが、HPCとしての使い勝手やアプリケーションの向き不向きなどに加え、既存プログラムからのマイグレーションやポータビィティなど結構不安要素が多い。
 こうした観点からの懐疑のために、TSUBAME2をGPGPU無しで、CPUだけでのシステムとして考えた場合のTflops単価を計算してみると、CPU Only Systemとしての性能は 216Tflops なので、¥1230万円/Tflopsという事になり、最近の導入事例との比較で言うと、京大基礎物理学研究所の日立のSR16000に対しては約2倍ほど高額ではあるが、物性研のSGI Altix ICE8400や先端研のPrimergyには何とか対抗できるような値ではないかと思う。
 このことは、面白おかしく言うと「ここ数年の国立研究機関でのスパコン調達の単価からすると、TSUBAME2の調達では4224枚のGPGPUを無料で手に入れたようなもの」ということになり、逆に、これまでの多くの国立研究機関でのスパコン調達は「何をやっていたのか」という事になるのである。


 TSUBAME2.0の調達費32億円とか、運用経費も含めた総額40億円とかいった額は、文科省・理研のKの開発費だけで総額1200億円前後というプロジェクトの妥当性を問い直すに足る額であり、科学技術予算の適正配分・有効活用という観点からも、Kの見直しは必須であろうし、スパコンの国家戦略の早急な見直しと再構築、それに関連した国立研究機関のスパコン調達の評価・見直しは必須と思うのである。

 

  
Posted by petaflops at 14:20Comments(0)TrackBack(0) スパコン 04 

2010年10月11日

「京(K)」の出荷開始で改めて考える次世代スパコン・プロジェクトの稚拙さ

 2010年9月28日、文科省の次世代スパコン「K」の第1号筐体が出荷され、以後2012年の6月までの「1年9ヶ月=21ヶ月」間をかけて、830台程度を順次出荷してゆくらしいことが判明した。
 土日休暇なしで、日産1.3台、週産9.1台、月産40台、程度である。21世紀の現在、こんな暢気な製造計画が有りなのかと思わざるを得ないような、19世紀的家内工業的腐臭の漂う、蝸牛出荷計画である。
 (注)理論値10Pflopsで833台程度、Linpack10Pflopsだと1000台程度は必要。

 世界のスパコン業界を常識的に眺めてみて、10Pflopsを2010年10月に達成するなら世界1の可能性はあるが、2011年6月では「見込み薄」、2011年10月では「ほぼ絶望」、2012年6月では「絶望」、と考えてよいであろう。 

 「世界一奪還」というプロジェクト目標を承知の上で、絶望蝸牛出荷計画を承認していた文科省・理研の「無責任さ」には、ほとほと、あきれ返るだけである。


<「落ち」の付いた「お笑い」国家プロジェクト>

 生き馬の目を抜くような熾烈な性能競争を演じている国際スパコン業界の中で、世界一奪還を錦の御旗に掲げ、税金を腹いっぱい囲い込んだ文科省・理研が、自らのオリジナルな製造計画で、量産試験完了後の、アッセンブリ開始から完了までに1年9ヶ月も掛けるプランであったなどということは、滑稽千万、とても信じ難いもので、この間の抜けたプランを承認していたことは、将に、背信といわれても仕方のないような頓珍漢な行為である。

 誰にでもわかることであるが、「1年9ヶ月=21ヶ月」、という長さは、半導体のテクノロジーが世代交代を起こすに足る期間であり、それに従って、CPUもメモリも、あるいはsystem本体も世代交代するに足る期間なのである。設計試験が完了し、量産試験も終わった後の純アッセンブリに21ヶ月掛かるなどということは、system.を組み立てている間に、systemの世代交代が起き、そのsystemは陳腐化してしまうわけで、永遠に、最新世代にはなれないといった「お笑い」プロジェクトプランという事なのである。
 
 この文科省の次世代スパコン・プロジェクトは、文科省が日本の基幹科学技術に指定している大国家プロジェクトであるが、昨年5月のVector部撤退により、基幹科学技術としてのコンフィグレーションはあっけなく崩壊してしまった大問題プロジェクトである。この大失態に加え、今回明らかになったのは、Vector部がなくなった片肺コンフィグレーションに於いても、製造がネックになって世界一にはなれないといった「お笑い」プロジェクトであるという事である。

 そして、このお笑いには「落ち」が付いていて、そもそものオリジナル・プランで「世界一にはなれないような自己矛盾の計画」を立てておいて、後で、この自分で埋め込んで置いた「矛盾」を取り除くためには多額の追加税金が必要などといった「落ち」が付いているのである。これは、納税者から見れば、「計画詐欺」のようなもので、「このプロジェクトは詐欺」だと非難されても反論の余地はないのではないだろうか。

 
<原因は800ラック超>

 こうした製造計画のいい加減さの原因の一つが、800台超という、馬鹿馬鹿しい数の台数問題がある。筆者は数年前から本ブログの中で、ラック数が256台を越えるようなsystemは異常で、設置面積、Usability,Availability,Maintenability、等々、あらゆゆる面で問題を来たす駄目systemと指摘してきたが、この度は、製造工程においてすらも台数問題が大問題の原因になっているということが判明したわけである。
  
 SPARC64-VIIIのチップ性能は128Gflopsであるから、  10Pflosp=10,000Tflops=10,000,000Gflops を実現するためには、概ね80,000チップ必要ということになり、取り巻き部品を含めた80,000セットの製造に21ヶ月(約640日)掛かるということである。逆算すると、土日休暇無しで、日産で125セット程度ということになる。

 Kのラック性能は12Tflopsで、SPARC64-VIIIを96チップ収容しているため、一日125セットのSPARC64では、組立可能なラック数は一日1.3ラック程度ということであり、833ラック超を製造するのには640日=21ヶ月必要という計算になるわけである。

 もし、Kのプランが、常識的な、256ラック程度であれば、現状の生産能力でも、6か月程度で製造は完了することになり、一般的には、この生産ライン能力が特別弱体であるとは思えない。

 こうしたアンバランスはプロジェクトプラン作成時点でわかっていたことであり、製造ラインを強化しない限り「世界一」達成は難しい事ぐらいわかっていたはずである。

 要するに、プロジェクトプランがいい加減、という事であり、本質的には、SPARC64-VIIIのチップ性能で、無理やり833ラック超も必要な、可笑しな「水増し」システムを計画したことが問題なのであり、製造の観点からも、KがCPUチップ性能を無視した「駄目システム」である事を示しているのである。


<生産増強100億円超の予算は無駄金>

 現実問題としては、生産能力を上げるにはSPARCの生産ラインを増やせばよいわけであるが、この生産ラインの増強に必要な資金をどうするかが問題である。

 SPARC64-Ⅷが世界の市場で継続して日産125セット以上多数売れる見込みがあれば、なんの問題もなく、製造メーカーである富士通が資金を調達するはずであるが、売れる見込みがなければ、メーカは投資に二の足を踏む。

 自ら進んで投資をしないということは、富士通側は、世界のスパコン市場で、SPARC64-Ⅷが、生産ラインを増強するほど売れる見込みがないと判断していることを示している。

 今時、売れる見込みのない製品に追加投資をするほど、お人好しの経営者はいない。生産ライン増強の追加投資は、Kのためだけの一時的要求で、商業ベースの生産とは関係なく、単なる一時的特注費用という事で、必要であれば、文科省・理研が追加費用を負担をしてくださいという事である。

 こうした文科省・理研の大失態の尻拭いのためだけに、100億円超といわれている経費を、補正予算だか本予算だかで支払う事など、全く、無駄金以外の何者でもない。経済効果の観点で考えても、今後市場で売れる見込みのないKの製造ライン増強など、何の意味もなく、全く無駄金である。



<補正予算で市場からスパコンを調達すれば、丸儲け>
 
 この額で、同じスパコン分野への有効投資を考えるなら、一般市場からのスパコン調達を考えたほうが遥かに遥かに有効である。今100億円の金を出すなら、軽く2-3Pflops、上手く入札させれば4-5Pflops、のスパコンは、すぐにでも、調達可能と思えるので、これを神戸のVector機の空きスペースに設置すれば、遅れて出てくる国策スパコン「K」の、早期の埋め合わせになるうえ、その後は、自由に使えばよいわけで、日本国としては、丸々2-5Pflopsを無償で手にいれたような結果に成るのである。

 そして、この2-5Pflopsのスパコンを、ポスドクのスパコン・デバイド連中などに安く使わせれば、科学技術振興への効果は、計り知れないものがある筈である。

 現在、我が国のスパコン関連施策の喫緊の課題は、世界第1位とか2位とかいった馬鹿げた競争ではなく、科学技術の足腰としてのスパコンの総台数とそれらの総計算能力の増進である。

 スパコンのハードなどは「唯の箱」、スパコンの心は「使い方」、つまり「ソフト」。

 ソフトウエアの飛躍的進歩は、PCの出現によるもので、それまで高価で不自由なMainframeでしか出来なかったソフト開発が、PCの出現により、個人が安価に必要なだけ機械を専有できるようになったことに因っていることは自明であろう。

 同じようなことが、スパコンのソフト開発にも当てはまるのである。高価で使いづらいセンター方式は、個人の創造性、生産性に対し多大な障害となっているわけで、出来ればパーソナル・スパコンが最良であるが、そこまでは行かなくでも、院生ないしは、ポスドクなどの若い連中が、出来る限り安価に長時間スパコンを専有出来る環境整備を行うことが、新しいスパコン・ソフトの創造に、最も効果的であることは、論を待たないであろう。
 
 まあ要するに直裁にいうと、文科省のスパコン予算の使い方・監査などは出鱈目であり、文科省のスパコン戦略は、方向性で極めて大きな誤りを犯しているということに尽きる。

 その誤りの最大の原因は、ハードとソフトのバランス感覚の無さで、「ハードは唯の箱」という感性に欠け、投資先はハード優先でソフトはオマケといった30~40年くらい前のハード万能の感性であり、そのハードに関しても、コスト意識が完璧に欠落していることである。

 このコスト意識のなさが、スパコンのテクノロジー・トレンドを見誤り、勝てないVector機と心中騒動を起こしたり、市場では売れないような総合チップ性能の劣る競争力のないCPUを製造が間に合わないくらい「ジャブジャブ」水増して、勝てない性能競争を煽ったりしたわけで、多額の税金を無意味にドブに捨てるようなことになってしまっているのである。
 
 
<日本のIT関連メディアのいい加減さ>

 この出荷の話題はNHKニュースでもとりあげられ、さらにはIT関係のメディアにも結構取り上げられている。

 傑作なのはPC-Watchで、製造会社は「生産体制も改善」との小見出しをつけ、「究極の平準化生産」に取り組んだと張り切って記事にしているのであるが、どっこい、その結果が1年9ヶ月に及ぶ「前代未聞の蝸牛納品」になったわけで、この記事は、将にこの「究極の平準化生産」が、プロジェクトの大目標である「世界一」達成不可の原因であるという事を理解していない、頓珍漢記事なのである。

 と同時に、この製造会社は、21ヶ月の間、理研向け製造に掛かりっきりで、この製品(K)を別の顧客へは納品は出来ないわけで、言い換えると、Kは別の顧客には全く売れない、ということを証明しているわけである。

 まあ、この「究極の平準化生産」で益を得るのは、親方日の丸の製造会社くらいで、この記事が、「究極の平準化生産」に焦点をあて、本来のプロジェクト目標とのミスマッチや、本来のプロジェクトプランの不備を指摘しないのは、公平な情報を提供する筈のメディアとして失格である。こうした単純な問題点を指摘しないことは、全く疑問であり、いい加減な提灯記事といわれても反論は難しいであろう。

 また、Cnet-Japanでは、「解説」などといった上目線で「解説:富士通の「京」出荷開始で改めて考える次世代スパコンの存在意義」などと、世界のスパコンの現状を全く知らないらしい「井の中の蛙」君が、ただただ富士通の担当者の言を組み合わせて「存在意義」を述べているつもりらしいのだが、世界の先端機との比較検討に基ずく「存在意義」の解説はないし、800ラック超などという「超水増し」システムの「存在意義」の解説もない。また、仕分けで遅れたわけではなく、オリジナルなプランで、2012年という驚くべき蝸牛生産計画に対する「存在意義」の解説も無い。余りに一方的な唯我独尊的解説で苦笑せざるを得なかった。
 せめてもの救いは、この記事は本家の米Cnetの記事ではなく、単に日本のITメディアCnet-Japanの独自提灯に過ぎないらしいことである。

 

  
Posted by petaflops at 00:27Comments(0)TrackBack(0) スパコン 04