2010年04月30日

GRAPE-DRは失敗作、税金15億円は無駄金

公開日時: 2009/07/04 01:02
著者: 能澤 徹



 2009-06のスパコンTop500277位にGRAPE-DRがリストアップされていた。東大は、早急に、GDRプロジェクトの結末を明確にすべきであり、公式な、成果の詳細発表を行うべきである。これは、プロジェクト開始時の大々的発表に対応すべきものであり、税金15億円支出に対する義務であろう。
 
 また、本投稿の目的は、GRAPE-DRプロジェクトの結果が、公式には何も公表されないまま、ウヤムヤに闇に葬られてしまう事に対する警鐘のためであり、また、後年に、結果を明快に参照可能なようにしておくためである。必要なのは、公式な結果発表であり、小賢しい、目くらまし情報操作もどきの、私的メモやブログの類ではない。 結果責任は問われるべきであり、責任回避は許されるものではない。
     
参照;GRAPE-DRはスパコンではないらしい!
     GRAPE-DRの性能 (その2
   Grape-DRの性能
   GRAPE-DRと次世代スパコン
 
 
<性能要点>

 2009年6月度 Top500リストより:

 277位  GRAPE-DR
 理論性能:84.48Tflops
 Linpack :21.96Tflops (実行効率26.0%)
 コア数 :8192 
 クロック:330Mhz

これが、2Pflops(2,000Tflops)実現を公言し、「地球シミュレータを1ラックで」などと言って、5年で15億円の税金を使った、鳴り物入りプロジェクトの成れの果てである。
 
             目標値      実現値      実現率
 規模(理論性能)  2,000Tflops  84.48Tflops  4.22% (1/16)
 実行演算性能   2,000Tflops  21.96Tflops  1.10% (1/100)
 相対実行性能              25.99%  
 Tflops単価    75万円      6,830万円
  
 要するに、5年かけて実現できたのは、目標に対し、規模(理論性能)で4.22%、実行性能で1.10%であり、実現した規模の中での実行性能は25.99%、という、「お粗末な一席」であった。


<コスト・パフォーマンス>

 コスト的には、開発費15億円を目標値で割ると「75万円/Tflops」であったが、実際に実現された実行演算性能ベースでは「6,830万円/Tflops」であった。  今日、米国では、理論性能ベース(実行効率80%前後)で、Intel4コアCPUNehalem-EPを使った場合$50,000500万円)/TflopsAMD6コア、Istanbulを使った場合は$35,000350万円)/Tflopsなどと報じられており国内では、理論性能ベースで、北陸先端大でのCray XT5が「約2,000万円/Tflops」であった。さらに、近々出荷されるであろう8コア版CPUによるコストパフォーマンス向上を考えると、特殊なGDRなどを用いるより、 市販の汎用スパコンを買ったほうが、遥かに性能的にも、設置面積的にも、「お得」ということになるのである。


<プロジェクト存在根拠の崩壊>

 そもそもGDRプロジェクト出自の論理的根拠であった、20045月のGDRプロジェクト開始報道発表2.提案の概要」の中に記されていた

「一方,高い計算能力を低コストで得るための手法としてのクラスタ計算機は,現実的に設置可能なサーバ台数の限界から汎用MPUを用いるだけでは100TFLOPSを越す性能の達成は困難であり,次世代の科学技術研究のための情報基盤として性能面での限界を持つ」

との汎用CPU・100Tflops限界断定は、今日のTop500リストを見れば、全くの出鱈目であることは一目両全であり、従ってGDRプロジェクト出自の正当性は完璧に崩壊してしまっているのである。その上に、アーキテクチャを含めた技術的稚拙さから実行性能は信じ難いほど低く、コストパフォーマンス的に汎用CPUの進化には追いつくことが出来ず、しかも「場所食い」で、結局、5年をかけて、GDRの存在理由が、一般的には、何も存在しないことを証明したということなのである。

  つまり、このGDRプロジェクトは「税金を投入する意味があるロジェクトであったのか」ということであり、単に提案者数人のためだけの「お遊びに過ぎなかったのではないか」ということで、税金の無駄遣いであったという結論にならざるを得ないのである。


<チップ・ボードに関して> 

 さて始めに、クロックに関して述べる。クロックのプラン値は500Mhzで、06年のチップ発表時は正常作動、07年11月のSC07では500Mhzと公表されたが、08年のボード発売時は380Mhz、そして、今回、プロジェクトの最終結果としては330Mhzという事なのである。プラン値の0.66.7%という事であり、当然、目標理論性能も2Pflopsから自動的に33.3%減の1.33Pflopsに低下してしまっているのである。

 クロックを08年の380Mhzから330Mhzへ低下させた理由は、普通に考えれば、380Mhzでは、Linpackの計算で8192コア128ノードの全ノードを、「数時間から数十時間、エラーなく連続作動させる」ことが出来ず、330Mhzに下げざるを得なかったということであろう。こうした度重なるクロックの変更は、如何に信頼性を無視した杜撰な設計が行われていたのかを示す好例であろう。

 と同時に、この結果は、SC07で発表していたPaperのデータは、ほとんど虚偽発表を疑わせるものとなり、倫理的問題を惹起しているように思うのである。



 次に、今回のGDRシステムの構成に関する補足を加えてみる。

 Top500のデータから判断すると、どうやら、1チップは16コアと計算しているようで、1コアは32演算器構成で理論性能は10.31Gflops、実行性能2.6Gflopsということになり、1チップ当りの理論性能は164.96Gflops、実行性能は42.89Gflopsである。 そして、ボード性能は、4チップ構成なので、理論性能654.96Gflops、実行性能171.56Gflopsとなる。

 このGDRチップのLinpack実行性能は、2.93GhzのNehalem-EP(4コア、理論性能46.9Gflops)のLinpack実行性能を90%とした場合の、42.2Gflopsと大差ない数値であるので、性能的に汎用CPUを凌駕するようなものではなく、逆に、近々出荷されるNehalem-EX(8コア)により軽く逆転されてしまうような性能なのである。

 GDRボードの実行性能もNehalem-EPの2ソケットボード2枚と大差ない事になり、また、コスト的にも、K&F社から売り出されているGDR+PCの2筐体セットが184.8万円であるから、Nehalem-EPの2ソケットボード2枚の買った方が安いか、あるいは同じくらいではないかと思う。米国での調達を考えるなら、GDRの約半値で調達できる程度と考えられる。そして、設置面積・体積的にも汎用PCボード2枚の方がはるかに小さくて済む。


 要するに、GDR は、チップ性能も、ボード性能も、ボード価格も、現状の市販の汎用サーバのボードと大差なく、逆に、用途に色々限界がある分マイナスであり、クロックの例からもわかるとおり信頼性にも疑問符が付き、将来プランも全く不明で、さらに、汎用CPUの8コア版が出荷されると、性能的に全く追いつかなくなってしまうということなのである。



<システムに関して>

  これまでGDRに関しては、チップ性能やボード性能に関する若干の情報はあったが、システムに関する情報は皆無で、5月にボードを収容する筐体の写真が出てきたことで、今回初めて推定ではあるが、ラックに組み上げたシステムの議論が可能になったわけである、これも一言でいって「お粗末!」としか表現のしようのないものである。

 K&F社によれば、作動可能なGDRのシステムはGDR1ボード筐体に別筐体のPCをPCIえケーブルで接続したもので、184万円となっている。GDR筐体にはボード2枚まで設置可能らしいが、売り出し中のものは1ボードであるので1ボードを想定すると、GDR+PCの2筐体ユニットで、実行性能171.56Gflopということになり、実質1ボード換算85.78Gflopsということになる。

 これは市販の4コア2チップのサーバ・ボードと大差ない性能で、しかも、GDRボードを収納する筐体は、写真で見ると、厚みが2.5Uから3U程度であるので、これにPCの筐体を加えると、1Uサーバ2枚に比べ、かなり厚く、マイナスである。つまり、設置面積・体積的には市販のボードの方がはるかに小さく済むような代物ということである。

 今回のGDRステムは全体で理論性能が84.48Tflopsという事なので、GDR+PCのペアが128組のシステムということになる。1ラックに8ペア積み上げるとすると、全体で16ラック必要ということになり、ラック当りの理論性能は5.28Tflops、実行性能は1.37Tflopsであり、1ラック4ペアであれば32ラック必要で、ラック理論性能2.64Tflops、実行性能0.686Tflopsということになる。


 このGDR程度の性能で、16ラックとか32ラックとかは設置面積的に「場所喰い過ぎ」で、CrayのXT5なら4ラックで十分お釣りの来る性能であり、BG/Pなら2ラック程度の性能であるので、Packagingに極めて問題があることを示している。


 2004年のプロジェクト開始発表時の2Pflops実現方法は、1ラック128Tflopsのラックを8ラック並べて1Pflopsシステムを作り、この1Pflopsシステム2セット間を高速回線で結合する事で2Pflopsを実現するというものであった。このノリが「地球シミュレータを1ラックで」とか「1ラック5千万円で」とかいった大言壮語を吹き出すベースになったわけである。

 ところが今回出てきた代物は、プロジェクト開始時のオリジナル・プランとは似ても似つかない、ダサくて、大場所喰いのシステムであった。地球シミュレータと同等にするには「1ラック」どころか「32ラックとか、それ以上のラック数が必要」と思えるような代物で、その落差は余りにもひどく、ほとんど詐欺といっても言いすぎでないような代物である。GDRのPackaging は、これも、「お粗末」の一語に尽きるのである。


<電力消費と設置面積>

 電力消費が「Roadrunnerには及ばないがBG/Pより良い」という結果は率直に評価したいとは思うが、どちらも1.1Pflopsとか0.8Pflopsとかで、性能規模が、GDRの22Tflopsに比べ、50倍、40倍といった本格的スパコンであるので、それらと比べられても・・・といった微妙な思いが残る。第一義的目標は性能であったわけで、主目標が駄目なので、他の分野の数値で「勘弁して」という言い訳は「聞きたくない」世界である。

 何れにせよ、PowerXcellにしろGDRにしろ、いわゆる多演算器によるアクセラレータ方式の方が、汎用CPUによるものより電力消費が少ないということは、マクロ視点で考えてみると、汎用化のために必要とされるゲート量を、アクセラレータ方式では、演算器に振り向けることが出来るためと言うことのように思えるが、逆に、アクセラレータ方式では適用分野に制限が発生しているということとも思えるので、一長一短であろう。



 GDRに話を戻すと、消費電力が少ない割には、設置面積(ラック数)が膨大ということは、Packagingがズブズブということで、設計が杜撰としか言いようがない。これでは性能を1Pflopsに上げようとすると、必要ラック数は700ラック以上も必要で、超大型の体育館の準備をしないと設置できないようなシステムである。正直、理解に苦しむ設計であり、杜撰、お粗末、としかいいようのない代物である。

 これはGDRのボード設計が極めて杜撰であったいう事であり、チップの機能集約やボード実装を含めたシステム全体での適切なPackaging設計が欠落していたということである。  設置面積は今日のスパコンの重要な評価関数であることを忘れてはならないことを強く指摘しておきたい。



<まとめ>
 
 エンジニアリングは結果が勝負であり、「屁理屈の議論や逃げ口上」、「責任転嫁」、などの「目くらまし」は、一切通用しない。「一生懸命努力した」などといった甘えも許されるものではない。

 結論的に、Grape-DRは、コストパフォーマンス、信頼性、設置面積、ほとんどの点で、落第点であり、しかもその落第の度合いが甚だ激しい失敗作であった。


 要するに、一握りの「狼少年」たちのお遊びに過ぎなかったわけで、税金の無駄遣い、としか言いようの無い物であったということである。

  

Posted by petaflops at 23:58Comments(0)TrackBack(0) GRAPE-DR 

スパコンTop500 2009-06、国別シェア

公開日時: 2009/06/24 01:07
著者: 能澤 徹




 2009年6月度 33rd版Top500のリストが発表された。

 Top1,2は変動なく、Top3に独ユーリッヒ研のBG/Pが825.5Tflopsでランクされ、非米第1位、欧州第1位にランクされた。第10位にもユーリッヒ研のSun Constellationが新たにランクされ、これはIntelのX5570(Nehalem-EP)を使用しており、注目される。

 日本の最高位は第22位のES2で122Tflopsである。

 国別の順位では、米国が台数ベースでも、Linpackの総計算力ベースででも世界の半分以上を占めており、次いで独、英、仏と続き、台数ベースでは、日本は15システムで、21システムの中国についで、第6位ではあるが、Linpackの総計算力ベースでは、辛うじて中国を押さえ第5位にランクされた。

 

スパコンTop10 2009-06


順 Site        System          Linpack-Tflops

01 LANL 米     PowerXCell+Opteron IBM   1105.0
02 ORNL 米     Cray XT5 QC Cray       1059.0
03 Juelich 独   Blue Gene/P IBM       825.5
04 NASA/Ames 米  Altix ICE 8200EX, Xeon    487.0
05 LLNL 米     Blue Gene/L IBM        478.2
06 Tennessee大 米 Cray XT5 Cray        463.3
07 Argonne Lab 米 Blue Gene/P IBM        458.6
08 Texas大 米    Sun x6420 Sun         433.2
09 LLNL 米     Blue Gene/P IBM        415.7
10 Juelich 独   Xeon X5570 Bull        274.8

  
  
日本のスパコン 2009-06

順 Site       System           Linpack-Tflops

22 ESセンター   ES2 NEC             122.4
28 JAXA      FX1, SPARC64-VII Fujitsu   110.6
40 理研      PRIMERGY X5570 Fujitsu     87.9
41 東工大 Opteron&Xeon+CSX600&nVidia SUN   87.0
42 東大      T2K日立 HitachiI        83.0
47 筑波大    T2K Xtreme-X3 Appro        77.3
65 核融研    SR16000 L2, Power6 Hitachi   56.7
69 東大・ゲノム SunBlade x6250, Sun        54.2
78 京大      T2K HX600, Fujitsu        50.5
93 物性研    Altix ICE 8200EX, SGI       42.7
259 天文台   Cray XT4 QC Cray          22.9
277 天文台   GRAPE-DR, Selfーmade        22.0
393 生命情研  Blue Gene/L IBM           18.7
396 高エネ研  Blue Gene/L IBM           18.7
397 高エネ研  Blue Gene/L IBM           18.7



国別シェア 2009-06


順 国   台数 台数   Linpack Linpack
位        シェア   GFlops シェア
01 米   291 58.20%   13,720,810   60.69%
02 独   29  5.80%   2,113,110    9.35%
03 英   44  8.80%   1,248,013    5.52%
04 仏   23  4.60%   1,004,743    4.44%
05 日本  15  3.00%    873,109    3.86%
06 中国  21  4.20%    788,125    3.49%
07 カナダ 8   1.60%    358,741    1.59%
08 瑞典  10  2.00%    343,447    1.52%
09 露   5   1.00%    261,682    1.16%
10 印   6   1.20%    247,285    1.09%
Total    500       22,607,996  




 日本の問題点は1年前の31st版のときに比べ、台数ベースで4.40%―>3.00%(-1.4%)、Linpack計算力ベースでの4.71%―>3.86%(-0.85%)と減少傾向に歯止めが掛からず、長期低落傾向が改善されていないことである。

 日本のスパコンの総リース料は、文科省の統計によれば年額一声260億円前後とされており、月額換算で21億6千万円程度である。これを今年4月に北陸先端大が導入したCray-XT5(19.6Tflops、月額961万円、4年リース)で換算してみると、およそ、4.4Pflopsの予算規模で、Linpackの実行効率を80%と仮定すると、Linpack計算能力としては3.5Pflopsの税金を投入しているわけである。

 ところが実際に調達したスパコンでの総計算力は0.87Pflopsであったということであり、明らかに調達がおかしいといってよいと思う。勿論、古い調達があり、最近の価格動向が反映されていないということも確かではあるが、平均して考えても、3.5Pflops vs 0.87Pflopsというのは余りにも差があり過ぎ、そうした弁解は有効性を持たないものである。少なくとも英国の1.2Pflopsは軽く凌駕できる予算額であり、ドイツの2.1Pflopsも射程内で、かつ凌駕可能な予算額である。


 要するに、各研究所や各大学の計算センター等のスパコン調達が杜撰としか言いようがないのである。各組織の調達担当者は、もっと賢い調達をすべきであり、その事が、日本の科学技術の足腰を鍛えるものであるという事を十二分に理解・認識する必要があるのである。調達担当者の奮起を期待したいし、科学技術に関心のある多くの人々は、税金による調達をより一層厳しく監視してゆく必要があろうと思うのである。


  
Posted by petaflops at 11:52Comments(0)TrackBack(0) Top500 Report 

次世代スパコンからのNECの撤退 (2/2)       <次世代スパコンの行方>&<国家技術戦略への影響>

公開日時: 2009/05/25 09:54
著者: 能澤 徹





<復習:国家基幹技術次世代スパコンの数値目標と文科省の国家技術戦略>

 次世代スパコンの行方を検討する前に、次世代スパコンの目標等に関して復習をしておきたい。

 文科省の次世代スパコンは、総合科学技術会議という日本の科学技術政策を統括する会議で「国家基幹技術」と認定され、閣議決定されたもので、その数値目標は、2010年にLinpack10Pflopsを達成しTop500の第1位とHPCC主要4項目で第1位になることである。
 Top500のタイミングは毎年6月と11月であり、HPCC11月であるので、目標年度が2010年ではあるが、実際には、Linpackの第1位認定時期は20116月度のISC11にならざるを得ず、また、HPCCでの第1位認定時期も201111月のSC11という事になるわけではあるが。


 目標実現の戦略は、「ベクタ・スカラ両輪論」という事で、ベクター型スパコンとスカラー型スパコンを別々に作成し、ハイブリッド結合させる、というもので、実施主体は理研、総額
1,154億円の巨額税金が投入される事になっているのである。


 これらの数値目標と達成年度は具体的で解りやすく、恣意的改変の出来ない明確な目標である。しかし残念な事に、これらの数値目標と
国家基幹技術というものの相互関係は甚だ曖昧で、合理的説明は無く、若干捏造気味の「各種ユーザからの機能要求調査」なるものにより「必要」といっているだけある。

 つまり、「実現できないと、国家戦略の何処にどのような困難が発生するのか」という相互関連が明確ではないのである。 素朴に「実現出来ないと特段な困難が発生する」とは思えないし、代替手段も多数考えられるので、「それ程のことはない」というのが率直な実感であろう。

 されどこの数値目標は閣議決定を経たものであるので、極めて重いもので、変更には、国家戦略内の相互関係の整合性を取り直し、それなりの手順で、それなりの承認プロセスを経ねばならないことは明らかであろう。



<次世代スパコンの行方>

 では、今回のNECの撤退は次世代スパコンの行方にどのような影響を与えるのであろうか?ソフトウエアが影響を受けるのは確かであろう。ここではハードウエア中心に考えてみる。

 
数値目標の具体的達成方法が開示されていないので、率直なところ、良くわからない。閣議決定より少し前の段階では、スカラ1.0Pflops、ベクタ0.5Pflops、専用機20Pflopsとなっていたが、閣議決定される前の総合科学技術会議の頃から、専用機は削除された案になっており、10Pflops達成の方法が不明になっているからである。

 しかし、NECの撤退に関しては、上述の閣議決定前の数値からも明らかなように、SXは、電力消費、設置面積などの関係からスカラ部の半分程度の性能が限界と考えられており、この意味において、今回のNECの撤退は次世代スパコンのLinpackの数値目標には影響を与えないものと考えられる。
 
 ただし
HPCCの主要4項目においては、SPARC64-VIIIの実力が未知であるため、この辺りに於いて一部の項目で影響が出る可能性はあるかも知れない、といった程度であろう。



 そもそも次世代スパコンは、「世界第
1位を確実にする」との気合が入る前は、1Pflops程度を狙っていたもので、受注を目指し富士通は3Pflopsのアドバルーンを打ち上げていたが、その3Pflops案の根拠に該当すると思えるのが、5月の「富士通フォーラム2009」で展示されていたSPARC64-VIIIfxで、8コア45nm,128Gflopsチップである。

 このチップは1ボードに4ソケット実装可能で、1ラック24ボード96ソケットとなっているので、ボード性能は512Gflops、ラック性能は12Tflopsのようである。
 これを
256台、24,576ソケット並べると3.1Pflops程度になるわけで、まあ、これがSPARC64-Ⅷの実行効率や信頼性、経済性などを勘案した、常識的な設計許容サイズではないかと思う。  
 勿論前提として、チップが設計通りに作動し、ボードやラックも熱処理を含めて設計どうりに実現され、インターコネクトもそれなりのものが供給される事が必要ではあるが。


 参考までに
Cray-XT54コアOpteron1ラック192ソケットで液令、インターコネクトはSeaStar2という3D Torusである(一般的に結合ノード数が多くなるとFat-Treeではレイヤが深くなり効率が著しく落ちてしまう)。
 ORNLJaguarの場合は、およそ250ラックで、全理論性能1.6PFflopsであるが、測定時の理論性能は1.38Pflopsで、Linpack1.06Pflopsであるので、実行効率は76.8%程度である。


 従って実行効率を安全サイドにやや低めに
70%と想定すると、SPARC64-Ⅷ3.1Pflop機はLinpack換算で2.17Pflops程度ということになる。


 数値目標の
Linpack10Pflopとなると、効率を70%としても理論性能で14.3Pflops、安全に見積もるならと1520Pflopsほしいところである。15Pflopsとしても1,250ラック120,000ソケット960,000コアである。


 あの地球シミュレータでさえ、
320ラック640ノードであったわけで、1,250ラックというのはSPARC64-Ⅷの常識的設計許容サイズと思える256ラックの5倍という事になり、常識的には限界を超え過ぎていると考えるべきで、インターコネクトのトポロジが複雑になり過ぎ実行効率は極端に低下し、消費電力・発熱なども限界を超え極めて不経済なものになり、トータルシステムの信頼性もかなり低下し、その結果、長時間の全システム連続実行が必要なLinpackの実行に於いては、途中でのエラー発生のため、データすら取れないようなシステムになるのではないかと思わざるを得ず、数値目標を達成できるとは考えずらいのである。


 このことは、筆者が
2年ほど前から指摘している次世代スパコン・プロジェクトに関する旧知の基本的問題で、今回のNECの撤退とは関係無く、本来的に内在している問題なのである。


 文科省・理研は、こうした基本的問題を、機密などとして、うやむやにしたままプロジェクトを進め、問題の先送りをしていると、最終段階に到り、取り返しのつかない破綻が顕在化することになるわけで、今回も、その事だけは強く指摘しておきたい。


 理研は数値目標が実現可能であるとするなら、当然、コア、チップ、ラック、システムと積み上げた達成の筋道を明示すべきであり、数値目標達成に対する疑問に数値で答えるべきであろう。


 と同時に、
SPARC64-Ⅷでの作成という事であると、もろに、Nehalem-EXとかOpteron-6コアとかの市販CPUによるシステムとの、屁理屈抜きの、きびしい国際価格性能競争に突入するということで、コスト的な勝ち目の目算提示も必須であろう。

 


<国家技術戦略への影響>

 国家基幹技術などと厳めしい表現ではあるが、実質的には、NECの撤退が国家技術戦略へ影響を与えるようなことは無いと思う。

 実際、
NEC撤退のニュースの後、他の国家戦略がどこかで支障を来たすといった類のニュースが報道されたことはなかったと思う。本当に支障があれば、何か報道されるはずであり、報道が無いということは、それ程、大きな支障は無い、あるいは、代替案でカバーできるという事であろう。

 ベクタ機による計算などとはいっても、計算は計算に過ぎないわけで、ベクタ機でなければ出来ないなどといった計算は無い。ベクタ機がなくなったとしても、スカラ機で計算すればよいわけで、せいぜい、プログラムを書き換えねばならない程度の話である。

 NECの撤退が国家技術戦略に関わるとするなら、それは実質的なものではなく、戦略内での論理的整合性の問題と、それに関わる責任問題であろう。
 戦略として「ベクタ・スカラ両輪論」などとして、「国家基幹技術」の両輪などと説明してきたのに、一方の車輪が吹き飛んでしまって、片輪で戦略を前進させることが出来るのか、という観念的問答である。

 つまり、もし、この情況で、このままで微調整程度で戦略を前進させられるというのであれば、そもそも、吹き飛んだ車輪は不要であったということであり、反対に、戦略を前進させられないというのであれば、国家技術戦略が破綻してしまうわけで、あまりに容易に破綻してしまうような戦略は、そもそも戦略としておかしいということで、いずれにしても矛盾が生じ、予算を含めて立案責任が問われねばならないと思うのである。


 業者の途中撤退といった事象の発生により、はからずも、
戦略そのもののいい加減さが浮き彫りになってしまったわけで、このいい加減な戦略を推進し、「国家基幹技術」などとして不必要な税金を浪費させた一連の人達の責任は重いといわざるを得ないであろう。



 付け加えると、筆者の目からは、文科省のスパコン戦略には極めて大きな欠陥がある。文科省の視点には、国際価格競争力という視点が全く欠落しているのである。

 文科省は国家技術戦略などと大上段に内向きに構えているが、開かれた国際社会における国家としては、たとえ国家技術戦略とはいえ、国際価格を無視することは出来ないであろう。国家の長期的な技術戦略とは、ある意味、国家の産業政策でもあるわけで、この観点から、日本のスパコンが国際市場の中で、価格競争力を有して独り立ちして生きて行けるのかどうかということは、極めて重大な問題である。にも関わらず、文科省のスパコン戦略には、この視点が全く欠落しているのである。


 これは国際市場へ打って出るまでもなく、文科省の戦略に含まれている「次世代スパコンの下方展開」といったフェーズで、国内に於いて、国際競争力が問われる事になるのである。

 性能に関する数値目標が達成できるかどうかといった論点とは別に、下方展開時に、価格競争力の観点から、海外メーカの輸入品に対抗できるのかという事も、性能とは別の重大な数値目標ではないかと思うのである。

 

 

 


  
Posted by petaflops at 11:45Comments(0)TrackBack(0) スパコン 03 | スパコン仕分け

次世代スパコンからのNECの撤退 (1/2)  <ベクタ機SXシリーズの行方>

公開日時: 2009/05/25 00:54
著者: 能澤 徹



 2009年5月14日、理研NECは、NECが文科省の次世代スパコン・プロジェクトの製造段階以降の作業から撤退する旨の発表を行った


 率直なところ、このような形で、破綻の第1歩が始まったのには驚いた。 直前に、2009年3月期のNECの連結決算が約3000億円の赤字で、NECエレは約700億円の赤字といったことは報道で知っていたし、NECエレがルネッサスと合併するという事も聞いていた。
 そういえば、年初頃に、NECが海外でのPC事業から撤退するといった報道も目にしたような気がする。しかしこれらが、「天領」である次世代スパコンに結びつくとは全く思っていなかったので、迂闊にもこうした前兆報道を聞き流しにしてしまっていた訳である。

 また、先日の富士通のSPARC64-VIIIの展示も、考えてみれば、NEC撤退のインパクトを和らげる布石であったようにも思える。もう少し調べてみると、色々な布石はあったのかも知れないし、結構根回しもあったのではないかと思う。まあとにかく、今回のNECの次世代スパコンからの撤退は、NECの事業リストラ策(選択と集中)の一環であったということは確かであろう。

 因みに同年3月期の決算では、日立は約7900億円の赤字、富士通は約1100億円の赤字となっているようで、2008年秋のリーマン・ショック以降、巨額赤字には麻痺状態で、各社個別の現実的意味を汲取れなくなってしまっていたように思うのである。

 

<NEC撤退の影響の範囲>

 まず始めに注意をしておきたいのは、このNECの撤退は経営上の判断であって、報道発表を見る限り、技術的に破綻したといったようなものではないので、直接的には以前から行われて来ている「ベクタ・スカラ論争」に技術的回答を与えたものではないということである。
 ただし、ヴィデオ・レコーダでのVHS vs Beta 争議からもわかるとおり、商業ベースの技術では、商業的に成り立ってこそ始めて技術ということになるので、技術といえども最終的には経営上の問題を避けては通れないということも事実ではある。

 さて、今回のNECの撤退は、何処に、どのような影響を及ぼすのだろうか?
 話が発散しないように、いくつかのレイヤに分けて考えて見たい。概ね3つのレイヤが有るのではないかと思う。身近なほうから言うと、
第1はSXシリーズの行方に関するもの。
第2は最も直接的なもので次世代スパコン・プロジェクトの行方に関するもの。
第3は次世代スパコンが国家基幹技術に指定されていることによる国家技術戦略への影響である。

 この3つの中でとりわけ厄介なのは3の国家技術戦略に関するもので有るが、とりあえず、1と2の局所的なものから順番に検討してみたい。

 

<ベクタ機SXシリーズの行方>

 今回の撤退の背景として、今にして思うと、NECエレのルネサスとの合併は大きなモメンタムではなかったかと思う。正確な情報は持ち合わせていないが、SXのチップはNECエレが作っていたと思うので、同社の分離、ルネサスとの合併で、NEC本体に属するHPC事業部から外部の他社への開発製造委託では無理が利かなくなってしまうであろうことを考えると、なんとなく撤退の背景を理解はできるのであるが、それより、経営側とすれば、半導体事業の中核であったNECエレをすら里子に出し、身軽にならざるを得ないのであるから、経営姿勢として、天領・聖域などありえないという事ではなかったかと思うのである。

 今回のハードランディングをやや歴史的視点で表現すると、「メインフレーム型ビジネスモデルの終焉」ということであろうかと思う。少量生産・高付加価値・高価格のビジネスモデルの終焉という事である。大量生産・高付加価値・低価格製品の追撃を受け、差別化できなくなり、崩壊するというパターンである。
 これは、米国では80年代後半から90年代前半にかけてメインフレームで顕著に起こったもので、IBMですら左前に追い込まれ、Crayも倒産してしまった訳である。

 SXは技術計算向けスパコンという特殊分野であったことと、「日本国株式会社」的風土とから、最後のメインフレーム型ビジネスモデルとして日本で生き延びて来たわけであるが、リーマン金融ショックという振るいにかけられ、やむなく脱落という事になってしまったのであろう。

 ある意味、これは時間・歴史といった「淘汰機構」による淘汰の結果であり、時期的な早い遅いといった多少の違いはあっても、いわゆる「時間の問題」であり、必然であろうことは間違いないと思っている。
 


 さて、NECの発表では、国プロの製造フェーズ以降は撤退はするが、今後とも理研と協力はしてゆくという事と、HPC(スパコン)事業は継続し、次世代HPCを創造してゆく、とのことである。

 明確なメッセージは、現在販売中のSXやスカラ型スパコンは継続して販売や保守サービスなどを行う、という常識的なものであるが、若干気になるのは同社のHPCの将来に関して「時代に適した次世代HPCを創造して」と述べている部分の解釈であろう。

 このNECの発表文全般に流れている雰囲気は、NECが考える今後のスパコンの方向は、ベクタ・スカラのHybrid、ということのように感じられるのである。つまり、ベクタ型の発展をベクタ単体ではなくHybrid型の方向に見ているように読めるのである。

 そして、経営基盤の悪化とは言え、国プロのベクタ部開発から中途撤退したのであるから、常識的には、単独でベクタ機の開発を再開することは、財政的にも、国・国民との関係からも、ビジネスの見通しからも、極めて難しいであろうと思うのである。つまりSXシリーズは現行製品のSX-9で終焉/停止と考えるのが妥当なのではないかと思うのである。


 一方、IntelやAMDのCPUのロードマップでは2010年以降にはMMX/SSEなどを拡張強化したAVX(Advanced Vector Extension)がコア内に装着されるようである。
 これは深読みかも知れないが、CrayがDARPAから受注したCascadeを支える意味があるのではないかと思っている。Cascadeは「Adaptive Computing」と呼ばれている Vector/ScalarのHybrid Systemで、アプリケーション・プログラムの特性に応じて、Scalar演算器やVector演算器、あるいはReconfiguarable な専用演算器に振り分けて、最適処理を行うというものである。Crayの現在のHybrid機XT5h(XT5+X2+Reconfiguarable)との違いは、ラックレベルでのHybrid vs ノード(チップ内orチップorボード)レべルでのHybridという事である。
 チップの場合、疑問は、誰がこのようなチップを作るのだろうか、という事であったが、どうも、IntelやAMDのAVXがこれなのではないかと思うようになっている。
 CrayはDARPAとの開発契約ではAMDのOpteronを使用するということになっていたが、確か昨年、IntelのCPUでも良いと許可を得たとされており、DARPAのAdaptive Computingでは、これらのAVXを有するHybrid型のCPUが使用されるのではないかと思うようになっているのである。

 となると、NECのHybrid戦略においては、SXの後継は従来のSX単体方式ではなく、IntelやAMDのHybrid CPUが採用されても不思議では無いわけで、CPU開発の巨額経費が節減でき、従来からのSXユーザにも顔が立ち、撤退の発表文とも整合性が取れるのではないか、などと想像をふくらませている。


 要するに、単体SXシリーズは終焉、後継次世代hybrid HPCは、SX改+x86系、又は、x86系単体、で実現という戦略ではないかという深読みであるが、正確にはNECからの発表を待たねばならないであろう。 

 ただし、このx86系単体での深読みではCrayもHPもApproも、名前の残ったSGIも、同じということになるので、差別化を何でするのかといった問題があることも注意しておかねばならないのは言うまでもない。


(2/2 に続く)

  
Posted by petaflops at 11:23Comments(0)TrackBack(0) スパコン 03 | スパコン仕分け

2010年04月29日

GRAPE-DRはスパコンではないらしい! (3/3)            <コメント欄>

公開日時: 2009/04/24 10:40
著者: 能澤 徹





*************
このエントリーへのコメント
*************


20
こんにちは。状況の読めない頓珍漢な興行師です。
(このような評価は、興行師にとって光栄なものだと、友人の興行師が言ってました。ありがとうございます。頓珍漢。素晴らしい言葉です!)

さて、スパムの件ですが、能澤さんのご推察の通り、2件、私の書き込みです。URLを本文中に挿入すると書き込めないのですね。お手数をおかけしました。

>要するに、現在は、作動して目的の性能を発揮できるか
>どうかだけが焦眉の急の問題であって、議論などする暇が
>あったら、動かす事に集中しなさい、といっているんです。

なるほど、能澤さんのGRAPE関係者への、叱咤激励の言葉だったのですね。大きな父のような厳しさ。愛を感じて思わずほろりとしてしまいました。

>従って、頓珍漢な興行師さんのご希望に沿うことは出来ません
>と明確に断っているんです。
>理解できているんでしょうかねえ? 

たびたび頓珍漢というお褒めの言葉、ありがとうございます。
つまり、牧野さん、あるいはGRAPE関係者がネット上で反論しても、それについてはなんら能澤さんの議論に影響しない、ということですね?やっと理解しました。読解力が無くて申しわけありません。

>そうそう、それから、「IBM側の人間である」などという、
>無責任で、いい加減なデマを書き込んでもらっては迷惑ですな。
>何を根拠にしているのか解りませんが、現在雇用関係も何も無い
>当方にとっては100%迷惑です。

なるほど。能澤さんは今「現在」、IBMとなんら関係ない、ということですね。了解しました。能澤さんのGRAPEに対する取材方法と同様に、私も能澤さんについてインターネットで調べさせていただき、てっきりIBMの社員の方かと思っておりました(その根拠としたURLを提示したいところですが、スパムとなってしまうので遠慮します)。失礼しました。インターネットだけの情報だと、不適切な場合があるということ、身をもって知りました。大変失礼しました。

なにはともあれ、今後も能澤さんの興味深い記事、期待しております。近いうちにGRAPEの報告もあがることでしょう。納税者にとって意味深い議論が展開されることを期待しております。

追記。
けれどもIBMのOBというのは確かなのでしょうか?5550は私にとって、思い出の多いマシンです。

testertestertestest on 2009/05/02

19
To コメント#17

 情況の読めない頓珍漢な興行師さんですな。

 この件に関する本質は、GRAPE-DRが、「目的の性能を発揮できるかどうか」なわけで、既にプロジェクト期間の5年が過ぎ去ってしまった現在の段階は、実証の段階です。あるいは、実証が完了していなければならない段階で、議論の段階などではないといっているんです。
 要するに、現在は、作動して目的の性能を発揮できるかどうかだけが焦眉の急の問題であって、議論などする暇があったら、動かす事に集中しなさい、といっているんです。
 
 従って、頓珍漢な興行師さんのご希望に沿うことは出来ませんと明確に断っているんです。
 理解できているんでしょうかねえ? 
 これ以上のシツコイ勧誘は、真正SPAMに指定せざるを得ませんよ!

 追加:
そうそう、それから、「IBM側の人間である」などという、無責任で、いい加減なデマを書き込んでもらっては迷惑ですな。何を根拠にしているのか解りませんが、現在雇用関係も何も無い当方にとっては100%迷惑です。また、関係が無いので良くはわかりませんが、IBMさんにとっても、多分、現在の当方が「IBM側の人間」などといわれたら迷惑千万だろうと思いますよ。

能澤 徹 on 2009/05/01

18
SPAMによるコメント欄の一時閉鎖に関する報告

ブログコメント欄一時閉鎖の理由:
 4/30日夕方、本ブログのシステムにより、30日に書き込まれた3件のコメントがSPAMと判定され、排除されでいる事に気がつきました。書き込みIDは<Sktnet>です。
 改めて、コメント一覧を確認したところ、さらに5件のコメントがSPAMとして、システム側で排除されていました。書き込みIDは<testertestertestest>
 どちらもシステムサイドの自動判定です。
 以前、semantics_groupというIDから、IPアドレスを次々に変えながら、訳の解らない、所かまわぬ、数百通の嫌がらせSPAMコメント攻撃を受けた経験から、早期予防措置として、コメント欄の一時閉鎖を実施いたしました。

ログの解析:
 Sktnetは2箇所のIPアドレスから書き込みを行っており、一方のIPアドレスがシステム側のBlackListに載っているのではないかと考えています。潜在的に要注意と思えます。
 Testertestertestestは1箇所のIPアドレスからの書き込みで、29日の5件の書き込みは排除されていましたが、その後の3件は通過しているようです。 今考えると、どうやらコメント内容にURL等が挿入されていてSPAMと判定されたのではないかと思えます。 システム側の正確な判定条件を知りませんので、依然、要注意ではありますが、通過分に関しては掲載しようと思います。

という事で、とりあえず、コメント欄を再開して見ようと思いますが、情況によっては、再閉鎖もありうることをご了承下さい。

能澤 徹 on 2009/05/01

17
>今、testertestertestestさんのコメントをザーッ
>と読みました。思わず、噴出してしまいました。
>あなたは芸能プロダクションの興行師さんか何か
>ですか???

喜んでいただいてなによりです。興行師、いいたとえですね。なにごとも面白く真実に向かわなければ楽しくありません。

>筆者は、事実を拾い出し、列挙して、それらに関する
>意見を述べているだけです。基本は事実の収集です。
>この事実確認の方法に、何らかの問題があるのなら、
>ご指摘下さい。大いに検討させていただきます。

方法になんら問題ありません。ゆえにいつも興味深く読ませていただいております。その能澤さんの収集された事実に対し、そのプロジェクトの当事者である牧野さんが反論されている、その反論が正しくないのであれば、能澤さんは再反論すべきではないかと思うのです。そして、反論をもとに議論を重ねなければいつまで経っても平行線となり、非難の応酬という、非生産的な行為に時を重ねることになるでしょう。能澤さんの主張が「ただ悪意を持っているようにしか、私には見えない」理由の多くの部分が、当事者の反論に対する反論を軸に議論を構築されない点にあります。逃げてるように、「見えます」よ?

>インターネットには様々な情報が氾濫しています。
>ほとんどが、根拠薄弱な、無責任で意味の無い、
>個人的な感想や思い付きでしょう。

全くです。しかしそれは個人の日記であろうが、大新聞といわれるメディアも同様です。ゆえに利用者はリテラシーを持たなければならないわけです。牧野さんの意見が当事者の証言として貴重であると同時に、当事者の証言であるがゆえに、バイアスがかかっている可能性がある。能澤さんの情報も、IBMの5550(←大変お世話になりました。ここであの製品に対する感謝と、開発に携わった能澤さんに敬意を表します。ただ、これはインターネット上で調べた情報なので、真偽は分かりませんが)の開発に携わってたと思われる、IBM側の人間である能澤さんの情報に対しても、バイアスがかかっている可能性を疑わざるおえないのです。こういう疑い深いスタンスは、どんな情報に対しても持つべきものでしょう。

>とりわけ日本のサイトはひどいものといわれて
>いるようですね
ご存知ないなら幸いですが、海外はもっと酷いようです。その「日本の状況がひどい」とおっしゃっていた方は、おそらく海外の状況をご存知ないのでしょう。是非「まあ、老婆心からですが、インターネットの時代ですから、情報くらいは、広く世界に求めたほうがよろしいんではないでしょうか?」とお伝えください。

>本稿は、これらを総合し、時系列性を考慮しながら、
>発表内容の相互関係をチェックし、矛盾点を洗い出し、
>結局、7との矛盾から、どうやら、情報操作がなされて
>いたのではないかと帰納的に判断しているわけです。

つまり能澤さんは、このプロジェクトに対し、結果発表がない、という一点のみで批判されているのでしょうか?牧野さんはこの点について、2009年4月の日記でこのように発言されています。

>ま、3月時点で数字だしてないのはこっちの
>プロジェクトマネジメントの 問題ではあります。
>来月中にはなんとか。

税金の無駄遣い、狼少年、などと扇情的な、東京スポーツの見出しのような言葉で罵るのは、今の段階では不適切に思います(あくまでも今の段階です)。

>あなたの発想は、失礼ながら、どうも本末転倒で、
>物事の本質が見えていない無責任な興行師さんの
>ようにしか見えませんよ。

全く失礼ではありません。シェークスピアの時代より、物事の真実を暴こうと、物語をすすめる役割は、常にピエロに与えられるものですから。

是非とも納税者にとって価値ある議論を望み、期待しております。

testertestertestest on 2009/04/30

16
To コメント#15
 今、testertestertestestさんのコメントをザーッと読みました。思わず、噴出してしまいました。あなたは芸能プロダクションの興行師さんか何かですか???

 筆者は、事実を拾い出し、列挙して、それらに関する意見を述べているだけです。基本は事実の収集です。この事実確認の方法に、何らかの問題があるのなら、ご指摘下さい。大いに検討させていただきます。

 インターネットには様々な情報が氾濫しています。ほとんどが、根拠薄弱な、無責任で意味の無い、個人的な感想や思い付きでしょう。とりわけ日本のサイトはひどいものといわれているようですね。まあ、狼少年もどきを見ても公式には、なんの役にも立ちません。また、匿名の無責任で破廉恥な嫌がらせのようなコメントも困ったものです。

 筆者が、事実として取り上げている情報は、基本的に、責任の明確なフォーマルなサイトの公式発表、あるいは、それに準ずると判断できるメディア記事などです。

 GRAPE-DRに関して言えば、
1.東大 記者発表 2004年5月26日 世界最高速のコンピュータ開発プロジェクトがスタート
2.東大 研究成果発表 2006年11月3日 記者会見「世界最高速のスーパーコンピュータ用プロセッサ チップ開発に成功 - ペタフロップス実現へ大きな一歩 - 」
3.SC07 Nov 13 GRAPE-DR
4.文科省 2006年12月 平成18年度科学技術振興調整費の評価結果等について
5.K&F Computing Reserach 社 Home Page
6.文科省 政府調達情報検索
7.プロジェクト期間が終了してしまっている4月24日現在で、新たな公式発表は認められなかった事。
などの情報を基にしたものであり、情報の出所を明らかにする意味で、参照URLにリンクしてあるはずです。
 本稿は、これらを総合し、時系列性を考慮しながら、発表内容の相互関係をチェックし、矛盾点を洗い出し、結局、7との矛盾から、どうやら、情報操作がなされていたのではないかと帰納的に判断しているわけです。
 従って、プロジェクト期間が終了してしまって既に1ヶ月も経過しているのに、公式に何の成果発表あるいは情況報告も無いことが問題なのであって、現在、プロジェクトサイドが最優先で行うべきことは、公式な成果発表ないしは情況報告を行うことで、「言い訳や逃げ口上」の議論などをしている暇は無いはずですし、しても全く意味は無いですけどねー。

 あなたの発想は、失礼ながら、どうも本末転倒で、物事の本質が見えていない無責任な興行師さんのようにしか見えませんよ。

能澤 徹 on 2009/04/30

15
こんにちは。いつも興味深く読ませていただいております。
今回の記事に対して、牧野さんは2009年04月の日記において反応されています。

以前にも、能澤さんの『Grape-DRの性能』という記事に対し、2007年12月20日の日記にて反論されていました。(能澤さんはご覧になってませんか?)

能澤さんの、ビルゲイツ引退についての記事、その中でのコメントで用いたロジックを援用するならば、以上のやり取りから、能澤さんがただGrapeに対して悪意を持っているようにしか「見えません」。また、おごちゃんさんの『おごちゃんの雑文』内の、2007年11月19日の記事、『ベクトル型スーパーコンピュータを批判する人々』の内容以上の感想を持ちえません。IBMのスパコン買えよ、といいたいようにしか「見えません」。

個人のブログならともかく、CNETというメディアが提供している情報である以上、税金の無駄遣いであるとの意見を、Grapeに対してもてない納税者の一人として、能澤さんの記事がどう「見えている」のかを、発信しなければフェアな議論が出来ないのではと思い、不躾ながら、書き込ませていただきました。現在のところ、一方的に「失敗であり、税金の無駄である」と、断定するのはフェアではないかと。(あくまでも今のところです)

できることならば、牧野さんの2009年4月の日記の内容(あるいはそれ以前の反論)に対する反論を基に、議論を再構築していただけると、一読者として非常に建設的であるように思います。よろしくお願いします。

なお、URLの表記があるとブログ内書き込めなかったので、引用記事は日付とタイトルのみです。これだけの情報でも、「まあ、老婆心からですが、インターネットの時代ですから、情報くらいは、広く世界に求めたほうがよろしいんではないでしょうか?」とおっしゃる能澤さんならたやすく情報にアクセスできると思います。

これからも興味深い記事を期待しております。

testertestertestest on 2009/04/29

14
書き込みテスト。

testertestertestest on 2009/04/29

13
To コメント#9
z80v9958さんのご主張にはほぼ同感です。

 敢えて付け加えさせていただくと、プロジェクトの失敗には、技術面での失敗と、マネジメント面での失敗があります。技術面での失敗は結構ある話ではないかと思いますが、そうした技術面での失敗を、なんとかカバーするのがマネジメントであって、マネジメント面でまで失敗となると重症だろうと思いますね。
 プロジェクト期間が終了しても、何の発表も行えないといった状態は、マネジメントが極めて可笑しいということです。民間では、人件費もプロジェクト予算に含めるのが普通ですので、プロジェクト予算が締まってしまうと、人件費も出なくなり、プロジェクトメンバを路頭に迷わす事になりますので、プロジェクトの終結方法や時期にかんしてはナーバスになりますが、こうした観点から、人件費が別会計の公務員のプロジェクトでは、意識が甘くなっているのではないかと思います。
 また、民間では、プロジェクトの失敗に関しては極めて敏感です。単に売上減、利益減といっただけでは済まず、損害賠償を請求される場合もあるわけですから、リスク・マネジメントには神経を使い、リスク兆候の把握や、迅速なマネジメント・アクションは必須です。こうした面からも、「失敗はしょうがない」といってお咎め無しで終わってしまう公務員は、プロジェクトマネジメントに対する意識が極めて低いのではないかと思っています。

 こうした意味からも、税金を原資として実施されるプロジェクトに対しては、外部から厳しく監視する必要があろうかと思っていますし、巨大な次世代スパコン・プロジェクトの行く末がどうなるのかは、気になるところです。

能澤 徹 on 2009/04/29

12
To コメント#8
 『私の所属している組織では「Aがダメ」という発言は無価値で「Aは~という理由でダメだからBという代案を提案する」という発言でないと誰も聞いてくれないのですが。』
とのことですが、以下に2004年5月26日の東大のGRAPE-DRプロジェクトに関する記者発表から、『2.提案の概要』のなかの当コメントに関連すると思える部分を引用してみます。

 『GRID技術は,ネットワークにより分散したコンピュータ資源,ストレージ資源を,場所を意識せずに使うことを目標として,1990年代の後半から盛んに研究開発が行われ,我が国へも導入されつつある.しかしながら,ミドルウェアを中心としたGRID技術は,期待は大きいものの実際の研究の現場ではGRID自身が研究テーマでない限り,殆ど使われていないのが現状である.一方,高い計算能力を低コストで得るための手法としてのクラスタ計算機は,現実的に設置可能なサーバ台数の限界から汎用MPUを用いるだけでは100TFLOPSを越す性能の達成は困難であり,次世代の科学技術研究のための情報基盤として性能面での限界を持つ.
  GRAPE-DRプロジェクトは,上記問題点を克服し,科学技術研究の現場で,高速インターネット,コンピュータシステムと大容量ストレージの持つ能力を世界最高の性能レベルで活用する情報システム基盤を構築することを目的とする.』
(筆者注) 「世界最高の性能レベル」とは後の部分で「PFLOPSレベルの超高速計算能力」となっています。

 yus-konnoさんの表現に当てはめるとGRAPE-DRは「A(Grid)は駄目」「B(汎用MPUのみによるクラスターシステム)は100Tflops達成は困難」従って、「上記問題点を克服し,・・・・世界最高の性能レベルで活用する情報システム基盤は、C(GRAPE-DR)である」という論理で税金15億円の予算を獲得したわけです。
 ところが、実際の世の中では、この提案の目標達成の手段としては完璧に否定されたB((汎用MPUのみによるクラスタシステム)で100Tflopsを軽く越すシステムが、安価に、多数出現しているわけです。つまり、提案・採択の論理が、多数の反例で、逆に否定されたわけです。
 こうした場合、yus-konnoさんの属する組織ではどうするのですか? 民間のお金持ちの組織なら別ですが、予算が少ない常識的な組織では、当該達成目標は、B方式で、税金による開発費0円でマーケットにより実現されるのだから、C方式は不要で無駄と考えるのが普通ではないでしょうか。それでもプロジェクトを継続したいというのであれば、別の論理が必要でしょうね。
 従って、まずは、構造的、あるいは論理的に「税金15億円の浪費」という事になるわけです。

 「GRAPEプロジェクトが今まで大きな失敗が無かったのがたたかれる原因ですかねえ」とのことですが、本稿の何処を読むとそうなるんでしょうかねー。理解しかねますね。
 本文を読めば、解ることですが、いくつもの例を挙げて、「情報の操作が行われ、『今まで大きな失敗が無かった』かのように報告されていたのではないか」という事を指摘し、問題だと思っているのです。
 2006年11月のチップ完成の発表では、「予定の速度で動作中」で、いくつもソフトウエアが作動しているということでした。この時、筆者がメデイアの記事を通して「変だなー」と思ったのは、提示されていたチップ内の構成図とプロジェクトの開始時の「データフロー演算器」「パイプライン化ネットワーク」といったアーキテクチャの落差が激しく、理解に苦しんだことと、チップ内演算器数が突然1000から512に半減し、単精度性能が512Gflops,であるのに倍精度が384Gflopsと可笑しな値になっていたため、どういう演算器なんだろうと理解に苦しんだこと、および、ホストPCとこの演算器チップは直接つながるのではなく、演算器制御のための別のFPGAチップを介して接続されらしいのですが、構成図の中では、このFPGAのチップは非常に小さく扱われ、まるで演算器チップとPCだけで作動するようなブロック図になっていて、1チップ512演算器は世界最高密度といったような宣伝が行われていたため、これは意図的な情報操作ではないかと思ったことなどです。
 そして翌2007年11月のSC07の発表Paperを見ると、500Mhzで作動中で、倍精度性能は256Gflopsとなっており、前年の報道発表の384Gflopsは何であったのか理解に苦しんだわけで、そしてさらにそのPaperの中のアプリケーション作動性能のデータも、実測値は1つだけで、他のデータは予測値というのであるから、イカモンPaperであろうと思わざるを得ませんでした。(拙稿「GRAPE-DRの性能」参照)
 そして昨2008年7月のボード発売で、今度は作動クロックが500MHzではなく380MHzというのですから、そもそも「予定の速度で動作中」とか、500Mhz でのアプリケーション実測データというのは情報操作であったのではないかと思わざるを得なくなったわけです。

 まあ、要するに、「情報の操作が行われ、『今まで大きな失敗が無かった』かのように報告されていたのではないか」という事で、逆に、大問題なのではないかと考えているわけです。

 というわけで、「大衆に迎合した文章」とか「理学系と工学系の研究の違い」などといった、意味の無い形而上学的コンニャク問答ではありませんよ。

能澤 徹 on 2009/04/29

11
何か私の意図がちゃんと伝わらなかったようです。

コメントには、「100TFLOPSを越す性能の達成は困難であり,
次世代の科学技術研究のための情報基盤として性能面での限界
を持つ.」という部分のみを取り上げて、「テクノロジーに
対する予測は「全く出鱈目」」と主張されていますが、これだと、
GRAPE-DR プロジェクトが、MPUだけを使用したクラスタ計算機では 100TFLOPS を越す性能の達成は技術的に困難だと主張している
ように見えてしまいます。これはちょっと言い過ぎで、無理が
あるというのが私の意見です。

もし、プレスリーリースをそのまま信じるなら、GRAPE-DR は
2-4TFLOPS/500万 ということですから、コメントでご紹介
していただいた中国ものと同程度になりますし、少なくとも、
それ以外に紹介されているシステムと比べればかなり価格性能比
はよいと思います。

それから、チップ云々の件は、既に本文に書いてあるとのこと
ですが、これは私が質問させていただいた箇所の1つ前の段落
を指しているのでしょうか?であれば、これは回答になって
いまえん。どうして、「処理速度や信頼性の向上には図り知れ
ない」と言い切れるのでしょうか?

最後に「まあ、老婆心からですが、インターネットの時代です
から、情報くらいは、広く世界に求めたほうがよろしいんでは
ないでしょうか?」ですが、これはあなたも、牧野氏の
「スーパーコンピューティングの将来」くらいは読んでご自分
の主張をなさってはどうでしょう?と言いたいと思います。

それに、私には、あなたの GRAPE-DR の記事は極端で悪意
があるようにしか読めず、全く建設的なものだとは思えま
せん。こいうのは、CNET のブログではなく個人のページ
でやるべきでしょう。

sktnet on 2009/04/29

10
To コメント#7
 『「高い計算能力を低コストで得るための手法」という部分を無視して、「狼少年」だと断罪するのはかなり無理がある』
というご指摘は、日本語の読解にかなり問題があるのではないでしょうか。
 原文は追加コメントに提示してありますように、
『一方,高い計算能力を低コストで得るための手法としてのクラスタ計算機は,現実的に設置可能なサーバ台数の限界から汎用MPUを用いるだけでは100TFLOPSを越す性能の達成は困難であり,次世代の科学技術研究のための情報基盤として性能面での限界を持つ.』
となっており、
【高い計算能力を低コストで得るための手法】で区切るのではなく、【高い計算能力を低コストで得るための手法としてのクラスタ計算機は】という事で、【汎用MPUを用いるだけ】の【クラスタ計算機】の事を述べています。つまり、「OpteronだとかXeonあるいはPower、SPARCなどといったMPUだけを使用したクラスタ計算機」という事です。Jaguarも、Pleiadesも、Rangerも、あるいはインドのタタのシステムなど、2008年11月のTop500のリストを見れば、上位20位にランクされたシステムのほとんどは市販の汎用MPUだけのシステムで、ほとんどが100Tflopsを軽く越しています。
 したがって『100TFLOPSを越す性能の達成は困難であり,次世代の科学技術研究のための情報基盤として性能面での限界を持つ.』という、GRAPE-DRサイドの断定は、明らかに、誤りであるということになります。
 という事で、sktnetさんの『かなり無理がある』という主張そのものが、“かなり無理がある”のではないでしょうか。

 参考までに、システムの価格に関しては、1~3年前のデータですが、当ブログ内の拙稿「T2K(筑波、東大、京大)とJAXAのスパコン」(2008/02/23)や「Top500: 日本のスパコン能力」(2007/11/14)、「スパコンの内外価格差、性能格差 」(2007/10/09)などに記述してありますので参照下さい。
 大まかに言うと、1~2年前の米国での汎用MPUによるクラスタ・システムの価格は1Tflops 当り1千万円を切る価格です。今日の為替レートでは、さらに10%~15%くらい安くなる計算になります。筑波のT2Kのように、これらを日本に輸入すると2倍から2.5倍程割高になり、東大や京大の国産メーカーによるT2Kは5~-6倍くらい割高になっていたと記憶しています。
 今日では、Tflops単価はさらに下がっており、先日読んだ記事には、中国の曙光(だったと記憶していますが)は2Pflops超のシステムを邦貨換算で20億円程度で作るとか書いてありました。若干眉唾で眺めていますが、作動すればTflop当り100万円という事です。
 まあ、老婆心からですが、インターネットの時代ですから、情報くらいは、広く世界に求めたほうがよろしいんではないでしょうか?
 それから、2チップ云々の件は、既に本文に書いてあったかと思いますので、本文を参照下さい。

能澤 徹 on 2009/04/29

9
研究開発に100%はないですから、時には失敗も仕方ないと思っているのですが、結果が発表されないのは良くないですね。失敗なら失敗でいいので、今回のプロジェクトで得られた知見を公表して欲しいものです。

z80v9958 on 2009/04/29

8
「税金15億円の浪費」大衆に迎合した文章とも取れますし、
理学系と工学系の研究の違いを認識していないようにも取れます。
GRAPEプロジェクトが今まで大きな失敗が無かったのがたたかれる原因ですかねえ。私の所属している組織では「Aがダメ」という発言は無価値で「Aは~という理由でダメだからBという代案を提案する」という発言でないと誰も聞いてくれないのですが。

yus-konno on 2009/04/29

7
少し気になったので、コメントさせていただきます。

まず、#1 への追加のコメントは、「高い計算能力を低コストで
得るための手法」という部分を無視して、「狼少年」だと断罪
するのはかなり無理があると思います。(例えば、ORNL の Jaguar と GRAPE-DR とでは予算規模が全然違うわけですし。)
もちろん、現在の GRAPE-DR Model1800 はマザーボードくらいの
大きさの代物なので、これではお金があっても大きなシステムを
うまく組めるとは思えませんが。

それから、本文中の「2チップで512演算器となり、GRAPE-DRと同じ演算器密度になるわけで、その上、処理速度や信頼性の向上には図り知れないものがあるのである。」というのはなぜでしょうか?
よく分かりませんでした。追加の解説があればよろしくお願いします。

sktnet on 2009/04/29

6
質問に答えてください。

chibafx on 2009/04/27





  
Posted by petaflops at 18:38Comments(0)TrackBack(0) GRAPE-DR