2010年04月27日

日本のスパコン戦略はボロボロ(2)          <地球シミュレータは失敗作> 

公開日時: 2007/08/29 10:00
著者: 能澤 徹


 文科省の「次世代スパコン戦略」がボロボロであることは前回のべた。なぜこれほどボロボロなのか? ボロボロの主たる原因は「地球シミュレータ」にあると考えている。



<地球シミュレータ(ES)は失敗作>


 ESに対するわが国での一般的な評価は大成功作ということで、これに対し異を唱えることはご法度のような雰囲気があるが、国外では、こちらの気持ちを慮り、当たり障りの無い表現でやり過ごすような雰囲気がある。

 先日のNYTimesのNSF‐NCSA関連の記事においては、「現在稼動中のmost valuable supercomputerはESである」といった主旨でイヤミたっぷりに記事を結んでいた。
 開発総額600億円、ハードだけで400億といわれているESの性能は35.86TFであるので、TF価格は11億円である。
 確かに単価的にダントツで「most valuable = expensive」であるが、これは取りも直さず価格性能比的には「least valueable = valueless」ということで、人を小馬鹿にしたような表現である。

 とはいうものの確かに、電力消費は、昔は7MW、近頃は6MWといわれているが、LLNLのBG/Lの280TF、2MWと比較すると、TF当たり23倍くらい多く、年間の電気代は5億円超、年間運営経費は60億前後ではないかといわれている。
 設置面積もESは3,250平米で、BGLの400平米の8倍で、単位性能当たりの設置面積は64倍である。
 ラック数もESは35.8TFで640ノード、320ラックであるのに対し、BGLは280TFで64ラックである。
 
 ラック数はラックの大きさにもよるが、0.9mx0.9mx1.8m程度のもので128ラック程度が常識的上限で、256ラックになるとかなり稀である。ESは320ラックであるので、超稀、ある意味ラック数の限界を超えているといっても過言ではない。

 ラック当たりの性能を比べてみると、ESは64パイプ、16CPUで理論性能128GFであるのに対し、BGLはラック当たり2048コア、1024チップで5,700GF(5.7TF)である。
 ESのラック当たりの性能はBGLの約45分の1で、ラック数は逆に5倍である。

 また、ESのInterconnectは640x640のcrossbar switchで、配線の本数は83,200本、距離2,400Kmである。
 本数はノード当たり130本で、内訳は128ビット並列のデータ線+2制御線である。この128ビットのデータ線は転送遅延を避けるためであるが、手作業にならざるを得ないラック外ケーブル配線としては異常な数であり、その手間を考えると、前時代的で信じがたい設計である。
 本数は640ノードx130本=83,200本であり、ケーブル1本当たりの長さは平均28.8mということになる。

 以上をまとめると、ESのCPU単体(NEC-SX-6)の性能は比較的高いが、CPUをラックに高集積化することは難しく、ラック性能は低い。
 ラック性能の低さをカバーするため、多数のラックが必要となり、設置面積も膨大となる。配線も創意工夫が無く、信じがたいほど長い距離となっており、しかもラック外配線は手仕事にならざるを得ないため、量産性、変更、拡張性、維持管理等々の観点で極めてまずい設計になっているのである。

  2002年稼動のESと2004年稼動のBGLを同一平面で捕らえることには若干無理があるが、それでも、こうした一連のデータは、ESの異常性を示しているように思えるのである。
 異常に電力消費が大きく、異常に設置面積も大きく、異常に総配線距離が長いのである。 

 これらはESというシステムが、その心臓部であるSX-6というCPUの演算性能、消費電力、発熱、集積性等々の固有パラメータから導き出せる妥当な設計限界を超えた、無理な設計になっていることの証左であり、システムとして弾力性、拡張性を失った失敗システムといって良いのではないかと思っている。
 金に糸目を付けず、消費電力もジャブジャブ、建物も代替のきかない巨大な特殊専用体育館に目一杯ラックを並べ、配線は東京・福岡間を往復するより遥かに長く、総体として動きが取れなくなっているのである。  

 結果として、ESは戦後の日本が育んできた「ものづくりの哲学」からはかなりずれた機械となってしまっているのである。
 ソニーにしろトヨタにしろ、日本のもの作りは「小さく・省エネ・高性能・高品質な量産品」で世界を席巻したのであり、PCでもToshibaのT3100(最初のノートPC)はこの延長線上に生まれた製品であった。

 どうしてESのような発想になったのかは定かではないが、バブルの後遺症か、「日本のものづくり哲学」のタガが緩んでしまったのであろう。
  筆者は、確かにESは性能的に世界の頂点に立ったし、その開発努力は評価するのにやぶさかではないが、それ以外のパラメータで評価する限り、完全にバランスを欠いた失敗作であり、日本の「ものつくり哲学」からは異質な機械であると判断している。

  さらに、まずいことは、この「いびつな」成功体験が、自由闊達で創造的な発想を阻害し、日本のスパコン戦略に暗い影をおとしていることなのである。



<文科省のスパコン戦略過誤の原点>

 国として戦略的に推進すべき基幹技術に関する委員会(第6回)配布資料  http://211.120.54.153/b_menu/shingi/gijyutu/gijyutu2/shiryo/005/04121701.htm

 これは2004年12月15日に行われた文科省の「科学技術・学術審議会」の「研究計画・評価分科会」の中の「国として戦略的に推進すべき基幹技術に関する委員会」(第6回)の配布資料である。
 この1ヶ月前の同年11月には地球シミュレータ(ES)はLLNLのBGLとNASAのItanium2によるColumbiaに世界1の座を明け渡していたことは周知の事実である。 

 第1回が同年7月5日であるので、国家技術戦略を決めるにしては拙速の感がしないではないが、ザーッと見たところでは第5回までは特に問題は感じなかった。
 問題はこの第6回の「プロジェクト候補に係る戦略性の検証例(資料2-2)」である。
http://211.120.54.153/b_menu/shingi/gijyutu/gijyutu2/shiryo/005/04121701/003.htm
 この検証例でスーパーコンピュータプロジェクトが取り上げられ、以下のように記述されている。

◎2. 日本ならではの視点があるか、他国では成り立たない戦略かどうか、他国との差別化がなされているかどうか。
 ・ 我が国の高度な半導体・デバイス技術、及びそのシステムインテグレーション技術や優れた人材の活用により世界をリードできる。また、地震、気象等の地球環境分野にスパコンを活用するのは我が国独自の視点と言える。世界がスカラー型へと移行する中、ベクトル型を推進していることも極めて戦略的。

 国家技術戦略というハイレベルな戦略検討の中で、
「日本ならではの視点があるか、他国では成り立たない戦略かどうか、他国との差別化」
との観点から、何の技術的検証・精査も無いまま、突然、「ベクタ型の推進が戦略的」と断定・例示されているのである。

 この流れは、資料3の「プロジェクトシステム抽出の方法論:スーパーコンピューターを例に」に受け継がれ、再度、「ベクタ型推進」が推奨例として示されているのである。(この「抽出の方法論」は、戦略プロジェクト立案の観点からは、あまりに稚拙、浅薄なもので、問題の多いものであるが、本論の論旨から逸脱するので、ここでは論評を行わない)
http://211.120.54.153/b_menu/shingi/gijyutu/gijyutu2/shiryo/005/04121701/005.htm  

 こうして、国家の技術戦略というハイレベルな戦略立案の中で、スーパーコンピュータ・プロジェクトでの「ベクター型推進」は、「検証例」「抽出例」という例示の形を取りながら、既成事実化されてしまっていたのである。    

 これは、明らかに「ベクタ型の地球シミュレータは成功である」という暗黙の前提に立ち、「ベクタ型は他国がマネを出来ない日本固有の技術で未来永劫世界に通用する技術」であってほしいという幻想を、そのまま国家技術戦略に組み込んでしまった最悪のケースなのである。
 技術動向の検証もなく、他の選択肢の検討も無く、突然、国家技術戦略としてベクタ型を推奨しているのである。

  国家技術戦略といったハイレベルな戦略立案で、一つのCPUアーキテクチャを推奨するなどということはレベル違いも甚だしく、また、国家戦略として一つのCPUアーキテクチャだけを推奨するなどということは、リスク管理の観点からも、最悪である。堅固な国家戦略立案を考えるなら、最低でもリスク管理の立場から、代替案は必要である。

 「世界がスカラー型へと移行する中、ベクトル型を推進していることも極めて戦略的」であるなどと寝ぼけたことを言っているが、現実には「なぜ世界はスカラ型に移行し、ベクトル型を捨てたのか」ということや、「世界から置き去りにされる」リスクを考えたのかということの方が、遥かに戦略立案上の重大関心事である。
 こうした戦略立案の常識から考えても、日本のスパコン戦略は「戦略では無く」、「思いつき」に過ぎないことが判るのである。

  言葉は悪いが忌憚なく言わせてもらえば、要するに、日本のスパコン戦略とは、戦略立案能力の無い人達が、訳もわからずに、たまたま世界1になった地球シミュレータの幻想成功体験を根拠に、十分な技術分析、競合他国分析、リスクマネジメント等の検討も無く、寝言を書き連ねたもの、ということになるのであろう。

 従って、これ以降、日本のスパコン戦略は、寝言と現実の技術の壁の狭間でメロメロになってしまっているのである。


  国民の税金の有効投資に関する重要案件なので、内閣府、文科省、理研の担当者の方々からのコメント欄を利用した反論を期待します。コメント欄の使用要請は論議の散逸を防ぐためです。


  なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。




***********
このエントリーへのコメント
***********

 
9
 日本のスパコン政策は、能澤氏の溜飲を下げるためにあるわけでも、能澤氏の自尊心を満足させるためにあるのでもない。 能澤氏の論理には詭弁、欺瞞が少なくとも二点ある。 一つめは「ESとBG/Lとの比較」で語っていること。 能澤氏の論理は、平たく言えば「ESはBG/Lよりも劣っている。よってESは失敗作である」という論理に過ぎない。 ESをPentium3、BG/LをPentiumMあたりに置き換えてみると、能澤氏の論理や主張が如何にに的外れでばかげた詭弁か分かる。ESがBG/Lに性能数値で劣っている「現在の」事実を、「ESプロジェクトは失敗である」と「過去の時間軸に対して」結論付ける論法に正当性などあるだろうか。 そして、もう一つは、「ESの製造コンセプト」を歪曲している、またはそれを一切無視して無理にBG/LとESを同一平面で騙っているということだ。「何のために作られたか」、能沢氏はそれを一切合財視野に入れてないのだ。 ES計画のコンセプトは「地球の海洋流・大気流の全球循環シミュレーション」。 ES計画は、これを可能にするために計画され、性能目標が定められ、それを達するためにアーキテクチャ設計され、製造され、稼動している。「ベンチマークテストで高得点を取るた
 WIND on 2007/09/05



8
 科学の成果がどうのと、抽象的概念で具体的成果のないものを誤魔化す。全く関係のない物理学者と、脈略のない例による議論の摩り替え。建設的でないとして、検証もせず議論を終了させる。 根拠もなく「正しい」と言い続けるお役所と同じ発想です。少なくとも、客観的な検証と議論をしないと同じことの繰り返しでは。こういう積み重ねが、借金大国ニッポンを形作っているのですね。
 Ogawa.T on 2007/08/31


7
 「○○は失敗」と声高に主張するよりも、「これは成功だ」と胸を張れるものを作るほうが建設的だと思います。
 T.Sakurai on 2007/08/31


6
 スパコンの性能向上なんて日進月歩。完成当時圧倒的な性能を誇っていたESに触発されて、各国のスパコンの性能向上の速度が速まったのも事実。今ではそうでもなくなってしまったからといって、失敗作であったと断じるのはあまりにも近視眼的。量子論との統合が果たせなかったからと言ってEinsteinの研究が失敗だと言えるのか?科学の成果はすべて過去の成果の延長線上にある。 げっきょ on 2007/08/31 5 訂正:話されていく× 離されていく○ AGGY on 2007/08/31 4 こんなことでは世界から話されていく一方ですね。世界中で売れるスパコンを作ること=TOP001 だと普通に思うんですがねぇ。 AGGY on 2007/08/31 3 スパコン?税金の使い方は、まるでゼネコンですね。 uetam on 2007/08/29 2 ウヒャー きびしいネ- でも ホントの事だよなー メーカの担当者もバカじゃないから こんな事は100も承知なんだろうけど 国が金くれるから やってるんでしょうか?  でも NECもこんな事に 技術者を投入するより 売れるスパコン開発した方が儲かるんじゃないの?   所詮 国には買ってくれない スパコン開発では いくら分捕っても 掛けた人件費や部品費の倍ぐらい しかも1回しか 売れないのでは しょうがい気がしますが  doc on 2007/08/29 1 ゼロ戦の誤解?大和魂シュミレータ。
 // ルート134 on 2007/08/29


6

スパコンの性能向上なんて日進月歩。

完成当時圧倒的な性能を誇っていたESに触発されて、各国のスパコンの性能向上の速度が速まったのも事実。

今ではそうでもなくなってしまったからといって、失敗作であったと断じるのはあまりにも近視眼的。

量子論との統合が果たせなかったからと言ってEinsteinの研究が失敗だと言えるのか?

科学の成果はすべて過去の成果の延長線上にある。

 

   げっきょ on 2007/08/31

 

5

訂正:

話されていく×

離されていく○

   AGGY on 2007/08/31


 

4

こんなことでは世界から話されていく一方ですね。

世界中で売れるスパコンを作ること=TOP001

だと普通に思うんですがねぇ。

 

   AGGY on 2007/08/31

 


3

スパコン?

税金の使い方は、まるでゼネコンですね。

 

  uetam on 2007/08/29

 


2

ウヒャー きびしいネ- でも ホントの事だよなー

 

メーカの担当者もバカじゃないから こんな事は100も承知なんだろうけど 国が金くれるから やってるんでしょうか?  でも NECもこんな事に 技術者を投入するより 売れるスパコン開発した方が儲かるんじゃないの?  

 

所詮 国には買ってくれない スパコン開発では いくら分捕っても 掛けた人件費や部品費の倍ぐらい しかも1回しか 売れないのでは しょうがい気がしますが 

 

   doc on 2007/08/29

 

1

ゼロ戦の誤解?

大和魂シュミレータ。

//

   ルート134 on 2007/08/29

 

 

  

Posted by petaflops at 15:19Comments(0)TrackBack(0)

日本のスパコン戦略はボロボロ

公開日時: 2007/08/27 00:30
著者: 能澤 徹



  前回述べたPIMに関連し、HOT CHIPS19のニュースが多いので一言。
http://www.eetimes.jp/contents/200708/23345_1_20070807181703.cfm

 このEETIMESのレポートは日本で報道されている多くのHOT CHIPS19のレポートとは若干視点が異なるもので興味深い。
 このレポートはマルチコア、メニーコアのMITのRAW/TILEや UTEXASのTRIPS等々より、コア間、メモリブロック間のチップ内/外コミュニケーション・アーキテクチャーの問題、および、オンチップ・メモリブロックの問題を取り上げている点が秀逸である。



日本のスパコン戦略はボロボロ


<閣議決定>

 日本のスパコン戦略は内閣府が所管する第3期科学技術基本計画(2006年ー2011年/H18-H23)の中でバイオ、ナノ、宇宙開発、等々と一緒に記述されているもので、2006年の3月に閣議決定されている。

 スパコン戦略は「次世代スパコン」を中心にしたもので文科省が提出したものである。その中での、わが国の技術力の現状認識や米国の状況認識などは、あまりにも世界の実情から乖離しているもので、首をひねらざるを得ないものである。

 たとえば調査会の資料に書かれている、
◆日本のとるべき戦略 
 ◎米国よりも優位にある技術で対抗
   ・高性能プロセッサー技術 (?)
   ・超高速ネットワーク技術 (?)
   ・専用計算技術 (?)
   =>汎用スパコンの実現に有利  (?)
 ◎理研の新型汎用スーパーコンピュータ(RSCC)の実績(優れた費用帯効果で高い実行性能を確保)を活用。 (?)

等とあるが、何処を叩くと、2006年3月時点で、このような現状認識に到るのか、理解に苦しむばかりである。
http://www8.cao.go.jp/cstp/tyousakai/kihon/haihu10/siryo1-2-4.pdf



 <文科省からの原案>

  これらの背景にあるものは文科省の「スーパーコンピュータ推進戦略」 2005年7月 文科省研究振興局 http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu2/shiryo/007/05082601/005.pdf
で、これで複合型が決定されており、これに合わせて「作文」がなされていると考えるのが妥当と思える。

 2005年7月に文科省が決定し、2006年3月に内閣府の第3期科学技術基本政策の中で閣議決定された「スパコン戦略」とは、
・大規模計算(ベクタ)
・逐次処理(スカラ)
・特定処理(専用計算機、アクセラレータ)
の3部分からなる複合計算機である。

 そして、この提案に対しては、閣議決定に先立つ内閣府綜合科学技術政策会議の評価専門調査会で多数の質問が噴出している。

◆評価専門調査会 最先端・高性能汎用スーパーコンピュータの開発利用評価検討会平成17年9月20日(火)15:30?17:30於:新霞ヶ関ビル CSTP会議室(1階)
http://www8.cao.go.jp/cstp/project/super/haihu02/siryo3-3.pdf
http://www8.cao.go.jp/cstp/project/super/haihu02/siryo3-2.pdf  
http://www8.cao.go.jp/cstp/project/super/

http://www8.cao.go.jp/cstp/project/super/haihu02/haihu-s02.html




<2006年、原案の数値>

 2006年の専門調査会での質問・回答を通して判明した「次世代スパコン」の概要数値を以下に示す。

2006年3月
       目標性能  目標性能  消費電力
       PF      PF      MW
       (45nm)   (65nm)  (65nm)
ベクタ   0.50     0.25     8.0
スカラ   1.00     0.50     6.5
専用機  20.00    20.00    7.0
その他                  18.0
合計   21.00    20.75    39.5
年間経費億円           81.4億円

 要するに、専用計算機で20PFを目指し、ベクタは0.5PF、スカラは1.0PFということである。
  つまり、諸条件から、ベクタ機は0.5PFが限界で1.0PFなど無理といっているのであり、スカラ機も1.0PFが限界で、といっているのである。
 当時既にBG/Lは0.28PFを達成しており、ANLに1.0PFのBG/Pが納品されるであろうことは周知の事実であり、DARPAのHPCSの3.0PFプロジェクトにはIBM、Cray、Sunの3社が最終契約競争を展開していたことも周知の事実であった。

 こうした状況下で 
”「日本のとるべき戦略」として「◎米国よりも優位にある技術で対抗する」"
ということの実態が、ベクタ0.5PF、スカラ1.0PFで、10.0PFは特定処理で目指す、ということなのであるから、このことは、とりもなおさず「優位にある技術は特定処理以外無い」といっているのであり、「日本のとるべき戦略」の大言が実態の無い虚言であることは明らかであろう。


 <2007年、理研・文科省の変更>

 しかし、これらの矛盾は、まだ、始めの第1歩に過ぎない。本当に驚くべきことは、2007年6月提出の理研の概要設計である。

 ご存知のとおり、「ベクター、スカラー、両輪論」などと気取ったことを言っているが、これは、戦略的に10.0PFを達成しなければならない特定処理(専用計算機)を、消し去ったということであり、ベクタ部かスカラ部のどちらかが最低でも10.0PFを達成しなければならないということである。 

 これは、本当に驚くべきことで、技術的可能性、電力消費、設置面積、など全てにおいて、閣議決定の内容を完全に覆す多大な変更を強いるものであるからである。これは10.0PF達成の可能性を疑わせるに足る重大な変更なのである。

 特定処理部が削除された理由は明らかにされていないが、この部分はGRAPE-DRが想定されていたことは確かで、GRAPE-DRが性能的に日の丸スパコンの期待値(実行性能10.0PF)に応えられないと判断されたためであろうことは推測に難くない。
 そもそも削除しなければならないような「役立たず」を基本政策に含めてしまったのは文科省の大失態であるが、なぜ「役立たず」なのかということの説明も無く「取り下げた」ということも理解に苦しむ点である。
 これらの点に関しては次回以降に稿を改め議論してみたい。



 <次世代日の丸スパコンの実態>


 この特定処理部の削除が「次世代日の丸スパコン」に対して与えるインパクトは計り知れない。 今まで0.5PFといっていたベクタ部か、1.0PFといっていたスカラ部で実行値10.0PFを達成しなければならないからである。
 そのため、性能達成そのものでさえ極めて難しい上、消費電力、設置面積、運用経費、等々においても多大な変更が必要となるはずであるからである。

 電力消費に関しては、2006年の65nm案で予測すると、ベクタ部で10PFの場合は160MW+スカラー部電力、スカラ部で10PFの場合は65MW+ベクタ部電力で、その他を含めて100MW前後必要と考えられるからである。
 これは完全に原子力発電機1基の1/10程度を必要とする程の電力消費量であり、年間の運営経費も2006年案の80億円強から一気に250億円超になるものと予測されるのである。

 こんな馬鹿げた機器や施設がほんとに必要なのか?

 文科省はこうした国民の疑問に対し回答する責務があるし、文科省、理研はこうした重大な基本データの変更に関しては迅速に公表を行うべきで、国会を通し国民にプロジェクトの継続の可否を問い直すべきである。   

 繰り返すが、こうした予測は、2006年に提出された文科省のデータから敷衍されるものである。もし、こうした予測が違うというのであれば、概念(概要)設計の数値データを公表すれば済むことである。データをもとに議論すれば、誤解も少なくなるし、無駄なエネルギーを使わなくて済む。 

 文科省、理研は、なぜ変更が必要であったのかを説明し、そしてその変更後の概要設計に関するデータを国民に提示し、了解を求める必要があるのである。

  因みに、ベクタ部は勿論NECのSXであり、ベクタ部の要不要に関しては既に議論はした。スカラ部は富士通製と噂さされている。

 
「富士通が次世代スパコンを開発へ,2010年に3ペタFLOPS目指す」  http://itpro.nikkeibp.co.jp/free/NBY/NEWS/20050622/163178/

 Primepowerに関しては、以前に述べたとおりPerformaceで問題があり、
 http://rblog-tech.japan.cnet.com/petaflops/2007/07/post_0774.html
 また、”九大のスパコンを「PRIMEQUEST」など400台超のサーバーで構築” と報道され、理論値31.5TFで25億円(Primepowerの例では実行性能比50%以下)ということでTF価格がおよそ8千万円で、国際価格やTSUBAMEと比べ、いかがなものかといった疑問符がつく。   
http://itpro.nikkeibp.co.jp/article/NEWS/20070314/265076/
  
 そして、3ペタの共同開発とスパコン購入という「合わせ技」は、国会の某委員会や某XX院が関心をもってもおかしくないとも思えるが、如何なものであろうか。 

 また、SPARCに関しては「紆余曲折の末、APLが4月中旬に登場、日本から“メーカー”が消える日も?」と報道されており、 国際的には当然、SUNのVictoria Fall、 ROCKに吸収されると考えられいるもので、文科省の投資案は、実態として意味のあるものなのか、甚だ疑問と思われてもしかたがあるまい。
 http://itpro.nikkeibp.co.jp/article/MAG/20070427/269779/





 国民の税金の有効投資に関する重要案件なので、内閣府、文科省、理研の担当者の方々からのコメント欄を利用した反論を期待します。
 コメント欄の使用要請は論議の散逸を防ぐためです。  




 なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。

**************
このエントリーへのコメント
**************


5
 To コメント#4
了解致しました。該当部分を訂正させていただきます。ありがとうございました。 昨今(2009年5月)次世代スパコン・プロジェクトからのNECの撤退の発表があり、改めて、以前の記述を読み直していて、nuclear さんのコメントに気が付きました。大変失礼致しました。
  能澤 徹 on 2009/06/03


4
 たしか原子力発電所は1基あたり100MWではなく、多いのは1,100MW (110万KW)出力のものですね。10PetaFLOPS機でもさすがに全部はいりません。
  nuclear on 2007/09/01


3
 戦前の日本の方がまだまともでしたね。戦闘機開発では軍が要求スペックを示してメーカーが試作機を開発し、比較検討してから採用・不採用を決めていましたから。
  アロン on 2007/08/29


2
 かつて通産省は気が遠くなるような資金をコンピュータ業界に投入しましたが、何物をも残していません。アメリカ国防省の資金で作られたDSPなどが世界中の人々の生活を豊かにしていることと比べると、その差に驚きます。アメリカでは絶えず性能目標を提示して競争を促し、最良なものを選んできましたが、日本では初めに選定した企業に任せ、成功しても失敗しても、その企業は大儲けとなります。この図式を変えない限り、「日の丸」と称するものが成功することはないでしょう。
  おじさん on 2007/08/28


1
 オープンな議論の要請は全く正しいと思います。なぜ能澤さんの心あるメッセージが広がらないのでしょうか。太平洋戦争の大敗北の轍を踏みつつありますね。これが日本人の本質なのでしょうかね。
  風見鶏 on 2007/08/27  
Posted by petaflops at 15:02Comments(0)TrackBack(0)

米国のスパコン戦略     <マルチコア、メニーコア、TSV>

公開日時: 2007/08/21 03:30
著者: 能澤 徹 米国のスパコン戦略


<マルチコア、メニーコア、TSV>

  前々回は2004年7月のHECRTFの Execuive Summaryに関して述べた。
http://rblog-tech.japan.cnet.com/petaflops/2007/08/post_2be6.html  
 今回はもう少し内容に立ち入って話をしてみたい。

 HECRTFは「HEC(High-End Computing)が科学とテクノロジーのリーダーシップのための戦略的ツールである」ということを前提に、ハードとソフトを一体と考え「HECを使いやすく、より生産的にすること」や「新世代のHECのシステムやテクノロジの開発、革新をはぐくむ事」などを目的(ゴール)としている。
 対象をハード、ソフト、システムに分け、ハードではマイクロアーキテクチャー、メモリ、インターコネクト、及び電源冷却パッケージングに細分化している。

 HECRETFは2002年-04年時点での米国のHPC(High Performance Computing、HECと同じで、今日的にはHPCが一般的)戦略を述べたものであるが、その立案手法は、戦略のスーパーマンがいて、トップダウンで一糸乱れぬ戦略を立案した、と言う類のものではなく、関係省庁のプランや、全米各地での利害関係者のヒアリングを行った結果を整理整頓し、整合性をとってまとめたものと考えてよい。 従って、当時計画中の案件は皆この文書に組み込まれていると考えてよい。

 ハードウェア・アーキテクチャ視点での主だった方向性としては、
○ アーキテクチャ分野ではビジネス・一般向けとは異なる高度科学技術向けのアーキテクチャが必要で、レイテンシ隠蔽や動的再構成などのHPCのニーズに応えるアーキテクチャーの開発
○ メモリ分野では、CPUスピードとメモリスピードのギャップ「Memory Wall」を埋めるため、新キャッシュ・アーキテクチャや、インテリジェント・メモリ・コントロラー、つまりPIM(Processors-In-Memory)やIRAM(Intelligent RAM)などの推進 などが指摘されている。



 <べクター・プロセッサーは無視>

 2002年に運用を開始した地球シミュレータは、米国のHEC戦略に強い影響を与えたはずなどと考えるのは、全くの誤解。
 予算要求のダシには使っても、アーキテクチャーとしては一言も言及は無く、完全に無視されている。
 HECRTFでは高度科学技術向けのアーキテクチャーとは言うものの、べクタープロセッサーの必要性などには微塵も触れていない。言外にべクタープロセッサーは「過去の遺物、化石」で、「いまさら復活させても金が掛かるだけ」と言った厳しい響きが込められている。
  ここでの「高度科学技術向け」とは、これまでのベクタ・プロセッサやPentium、Athlon,あるいはAlpha、MIPSなどの延長ではなく、
- マルチコア(チップ・マルチプロセッサ): Power4、BG/L、CELL BE
- メニーコア(セルラ・アーキテクチャ/タイル・プロセッサ):Cyclops、MIT-RAW、UTexas-TRIPS (Univ. of Texas at Austin)
- レコンフィギャラブル・プロセッサ
等である。
 その結果が、現在のマルチコアのCore2やOpteronであり、Power系のPower5/6、Blue Gene/P、Cell BE、最近のSunのUltraSPARC T2などであり、あるいは、Intelの80コア、TileraのTile64などである。  
 
 はっきりしているのは、米国の方向は、マルチコア、メニーコアであり、べクタは過去の遺物で、文化遺産保護的に日本を藪にらみしながらCrayに残しているに過ぎないということである。

  なお、米国でのべクタープロセッサに関しては、確かに2002年頃、DoEのOS(科学局)のNERSCの一部にべクターを強く押したグループが居たのは確かであるが、DoEの中ではマイノリティに過ぎず、日本において、このグループの動きをマジョリティであるかのように宣伝し利用した人達が居たのは公平さを欠き残念なことであった。
 その後遺症は現在の日本の次世代スパコンプロジェクトの戦略に暗い影として残っているように思っている。

 また、最初のデュアルコア・チップであるPower4は、そのチップ4個を一つの実装モジュールにマウントしたマルチチップモジュール・プロセッサーで、チップ内UMA、チップ外NUMAのシンメトリックで端正なデザインであったが、Performanceがデザインどうりには上がらず、筆者の判断では、失敗作であったと思う。これはL2キャシュの位置に問題があり、結局Power5でキャッシュの位置を変更せざるを得なかったことからも明らかであろう。従って、Power4を使ったIBMのP690サーバーは計算サーバーとしては理論値ほどにはPerformanceの上がらないサーバーであった。
 ところがこのP690をスカラー系の代表としてSXとの性能比較に使用したため、スカラーvsべクターの話がおかしな方向に進んでしまったように記憶している。



 <マルチコア、メニーコア>

  HECRTFのメモリ分野でのPIMとかIRAMは、一言でいえば、RAMの中にプロセッサを配置したチップのことで、「Memory Wall」を解くため90年代に議論の始まった考え方である。
 PIMはIBMのFSDに在籍し、その後インディアナのノートルダム大へ移籍したP.Koggeが使用していた言葉でHPC向けであり、IRAMはUCBのPaterson等が使用していた言葉で、携帯電話などの機器での使用を狙ったものである。
 KoggeはPIMの考え方を1993年にEXECUBEで実験し、その後もノートルダム大で研究を継続し、SC00でPIMについてスピーチをしていた。その後KoggeはShamrockと言うPIMチップを試作しているといった噂を聞いたことがあるが、詳細情報は持ち合わせていない。

 KoggeのPIMの考え方はIBMの基礎研の中ではCPUとメモリを一体化したコアを単位とした「Cellularアーキテクチャ」の考え方となり、90年代末に、基礎研のMonty Denneauによりマルチセル(メニーコア)・チップのCyclopsが提案されている。

 このCellularアーキテクチャの考え方により、PIMをベースにしたマルチコア/メニーコアの考え方が広まってゆくことになるのである。 PIMのいうロジックとメモリ(SRAM/DRAM)の混在はチップの製造上の問題の比重が大きく、マルチコア、メニーコアになると、チップ製造上の問題に加え、コア-メモリ間の結合方式が大問題となる。

 CPU数、メモリバンク数が増えるとコンテンションが増え、UMA, NUMAといった従来からのバス制御方式では解決がむつかしく、今日では、チップ内にフル・クロスバースイッチを持ちこむことが一般的となっている。  
 OpteronのHypertransport, UltraSPARC T2のFull Crossbar、Intel 80coreの6方向へのCrossbar Router,等々、スパコンのインターコネクトと同等ないしはそれ以上のチップ内インターコネックト・アーキテクチャが求められているのである。
 
 加えて、メモリの配置に関しても、単なる「同一チップ上での混在」から、ロジック・チップにメモリチップを積み上げ、チップ間を直に結合するTSV(Through Silicon Vias)が提唱され、Intelの80coreはこの方式を前提にしていると言われている。 この方式はPIMのチップ面積を広げる代わりに、上下方向にチップを重ねるもので、PIMのヴァリエーションが増えたことになると同時に、メニーコアに対しては十分な量のメモリの供給を可能にするもので、チップ内Crossbar Switchとあいまって、今後の展望に大きな意味を持っているものと考えられる。

 ただし、TSVはスタックするDieサイズを同一にしなければならないなど制約も多く、製造上難しい技術であることも確かである。 TSVは2001年頃シリコンバレーのVenture企業が提唱していた技術で、IBMは2007年にサンプル出荷、2008年に製品出荷を行うと報道されている。 http://arstechnica.com/news.ars/post/20070412-ibm-goes-vertical-with-chip-interconnects.html


 かくして、米国のスパコン戦略は「高度科学技術向け」とはしているが、結果としては、一般のサーバーやパソコンの技術といってもよいもので、商業活動と一体化した方向で進んでいるといってよいであろう。



 #Cyclops
 このCyclopsはメニーコアの元祖であり、また、最初期のBlue Geneが想定していたプロセッサーであったが、各セルの必要メモリサイズが大きく、水冷を前提にするなど、チップ実現には多くの問題が予見されたため、2001年11月のLLNLとIBMのパートナーシップ締結時点で、基礎研はBlue Geneを実現可能性の高いQCDSP-QCDOC系列に変更する大決断を行い、現在のBG/Lがメインとなった。
 CyclopsはしばらくBG/Cなどと呼ばれたこともあったが、現在ではBlue Geneラインからは外れている。
 現在CyclopsはDelaware大がシステムのシミュレーションなどを行ってはいるが、今のところIBMサイドからは製品化の話題などは上がっていないと理解している。
 Delaware大のドキュメントは年度によってCyclopsの仕様が若干異なっているが、2007年のドキュメントではCyclopsは1チップに80コアで、各コア及びメモリブロックとはクロスバースイッチで接続される構成を想定している模様である。

 #BG/L
 BG/LのチップはPPC440の2コア+4FPU構成で、メニーコアではないが、チップに4MBのDRAMを埋め込んでおり、Cellular/PIM構成である。多分ASICのCPUロジックとDRAMが同一チップに共存した最初の商業用チップであろう。
 バス構成はチップ内はSMP-UMAで、チップ外へは3D-Mesh(Torus)、Collective Tree、Controllの3つのネットワークが独自のlink Chipで実現されている。 
 
 因みに、BG/Lのチーフ・アーキテクトはColumbia大学のQCDSPのデザイナーで、1998年にGordon BellのCost/Performance賞を受賞したAlan Garaで、受賞後の1999年にIBMの基礎研にリクルートされた人物である。つまりIBMの基礎研はQCDSPのアーキテクチャを拡張性のあるものとして高く評価していたということになる。


 #CELL BE
 同じく、BG/L計画が具体化した2001年は、IBMの半導体製造部門がSony+Toshiba組とPS3用の「CELLプロセッサー」の開発を開始した時期でもある。ご存知の通り、PPE+SPEx8、バスはLoop型のEIB、メモリはPPE、SPEにLocal Storeを保持する、ヘテロなメニーコアの形態といってよいであろう。 記者会見などでは、CELLと言う名称はSONYのデジタル家電全般で使用する基本制御プロセッサと言う期待をこめたものとされているので、公式にはCellularアーキテクチャの「Cell」とは関係ないということになる。
 
 
#MIT Tile
http://arstechnica.com/articles/paedia/cpu/MIT-startup-raises-multicore-bar-with-new-64-core-CPU.ars http://www.tilera.com/products/products.php


#Utexas TRIPS http://www.cs.utexas.edu/users/cart/trips/publications/computer04.pdf #Intel 80core http://arstechnica.com/news.ars/post/20070212-8824.html


#Ultra SPARC T2 (DataSheet 参照) http://www.sun.com/processors/UltraSPARC-T2/  





なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。  
Posted by petaflops at 14:07Comments(0)TrackBack(0)

日々雑感(2/2) <スカラ型とベクトル型を両輪に、理研の説明>&<綜合科学技術会議 評価専門調査会(第67回)議事次第 平成19年8月6日(月)>

公開日時: 2007/08/15 00:30  (続き)

著者: 能澤

 

 

 

<スカラ型とベクトル型を両輪に、理研の説明>

 

http://techon.nikkeibp.co.jp/article/NEWS/20070808/137619/?ST=lsi

 この「両輪」論は、「なぜベクター型が必要なのか」という疑問に対する答えには全くなっていない。単に「Nice to Have」と言うことである。

説明の図のベクター型の部分をスカラー型で置き換えて、スカラー両輪にすると、何が悪いのかについては全く答えていない。

 

‐ ベクター型でなければ解けない問題があるのか?

‐ スカラー型で実行するとどのような不都合が生じるのか?

‐ 不都合があるなら、その不都合を定量的に示す必要がある。

‐ その量的不都合は、商業的に先が無いと思えるベクター型スパコンに
  巨額の投資をして新たな開発をしなければならないほどのものなのか?

‐ 海外では殆がスカラー型だけで済ませているが、
  日本にはスカラー型では済ませない問題があるのか?





 

<綜合科学技術会議 評価専門調査会(第67回)議事次第 平成19年8月6日(月)>

 


 若干疲れて飽きてきたが、もう一つ。

 

 「この道はいつか来た道」、過去に旧通産の「第5世代コンピュータ・プロジェクト」や「シグマ・プロジェクト」などで、600億だ、300億だといった大金をドブに捨て、世界の笑いものになった官庁主導の悪夢の巨大失敗プロジェクトの経験から何を学んだのであろうか?

 

http://www8.cao.go.jp/cstp/tyousakai/hyouka/haihu67/haihu-si67.html

 綜合科学技術会議は内閣府におかれている重要政策会議の一つで、基本科学技術政策の調査審議などのほか、総予算額が300億円を越える科学技術プロジェクトの評価を行うことになっている。「次世代日の丸スパコン」は総予算が平成18?24年までで1,154億円とされているため、この綜合科学技術会議の評価対象プロジェクトなのである。

 この「最先端・高性能汎用スーパーコンピュータの開発利用について(原案)」は、上記法律に基づき、「6月に公表された文科省の次世代スパコンの概念設計に対する評価報告」の評価を綜合科学技術本会議にかけるため、評価専門調査会としての意見の取りまとめを行ったもので、その原案が綜合科学技術会議のWebサイトに掲載されたものである。

 

 結論的には文科省の評価報告の追認で、お決まりのパターンである。留意点が5項目付与されているが、どれもmotherhoodなもので、特段印象に残るものではない。

 

 ところが、本論の後ろに付けられた3つの補足は大変に興味を引く内容なのである。補足1は文科省への追加説明依頼事項、補足2は評価の論点(案)、補足3は評価コメント、となっている。これらは評価検討会の各委員の意見の要約を列挙したものと思え、大変興味深い。と言うより、筆者が本シリーズの<1-1>から<5>までで述べてきたことの要点が、ほとんど含まれており、

ー「なぜ複合型なのか」から始まって

ーいきなり45nmの使用や、ESの高々40テラからいきなり10ペタへ、などといった大ギャップを越えることの実現可能性の問題

ー消費電力や設置面積の問題

ーこれらのギャップに対するリスクマネジメント」の問題

ー商品としての価値や国際競争力の問題

ー等々、

極めて「当たり前」の疑問である。なぜこうした政策レベルの「評価の評価」に、このような技術的色彩の濃い疑問が呈されたのか驚きであった。逆に言うと「文科省の評価」は綜合科学技術会議の評価専門調査会の委員が感じた自然な疑問を全く無視した報告で、極めて不自然で恣意的なものであったという事の証左なのではないかと思わざるを得ないのである。

 

 そして、驚くべきことは、評価専門調査会報告(原案)の補足に記載されている多くの疑問の列挙と、評価本論での結論、の間の落差である。疑問に対しどのような回答がなされ、それらがどのように解決し、どのようにして「文科省の評価」が追認されるに到ったのか皆目不明なのである。

 

 意地悪く勘ぐると「結論ありき」の官僚の作文と、ピエロのガス抜き、といういつものシナリオなのではないかとさえ思わざるを得ないのである。正確なところは各評価委員に聞いてみないとわからないが、一般論として過去の審議会などの例では、出席委員もなぜこうした結論になったのか全く不明、といったような強引な例も多く、こうした闇での議事運営に疑問を呈した委員は次からは「お呼ばれしない」といった姑息な手段を繰り返す狡猾な役人が多いことは指摘しておいても無駄ではないであろう。

 

 当該報告(原案)には参考4と参考5があり、そこに文科省が提出した資料の目次がリストされているが、目次だけで内容はWebには公表されていない。そして、その中の以下の重要資料はそもそも「会議後回収」となっており、綜合科学技術会議も保持していないらしいのである。

ーシステム開発経費

ー次世代スーパーコンピュータ概念設計評価報告書 補足説明資料

ーシステム構成案の概要と検討経緯

ーハードウエア要件、LSIの論理構成及びシステムソフトウエア概略

ー最先端・高性能汎用スーパーコンピュータの開発利用

ーターゲット・アップリケーション実行時の電力性能比

 

 そもそも、この程度の資料がなぜ機密なのか極めて疑問である。こうした隠蔽体質では、科学技術という言葉を隠れ蓑にした「官製談合による公共事業」なのではないかといった辛辣な批判を受けてもやむを得ないのではないだろうか。 これで国民は1,154億円もの税金投入を承認することが出来るのであろうか? 全く説明責任を果たしておらず、あまりにも国民をバカにしているように思えてならないのである。

 

 理研、文科省は、最低でもこの程度の資料は公開すべきであり、もし機密にしなければならないのであれば、公開することでどのような問題が発生するのか明らかにし、国民の了解を求めるべきではないであろうか。

 理研、文科省の良識に期待したい。

 

<お詫び>

 ここ2回ほど日々のニュースに反応してしまい、「米国のスパコン戦略」に関する記述が中途半端になってしまっています。次回はぜひ続きを行いたいと思っています。

 

 なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。

 

 

  
Posted by petaflops at 13:38Comments(0)TrackBack(0)

日々雑感(1/2)<米大統領、「America Competes Act」法に署名--科学技術競争力の維持を支援>&<NSF (全米科学財団)>

 公開日時: 2007/08/15 00:30

著者: 能澤

 

 

 

<米大統領、「America Competes Act」法に署名--科学技術競争力の維持を支援>

 

http://japan.cnet.com/news/biz/story/0,2000056020,20354547,00.htm

この法案は、今後科学技術立国を目指す日本にとって、ボディー・ブロウのように効いてくる法案のような気がしてならない。「ぶっちぎりの世界1」などと「ちゃらちゃら」しているうちに、ハードもソフトも、頭脳(人員)も、完全に水をあけられてしまうこと請け合いである。


 そもそも、一点豪華主義、センター集中型、などという考え方そのものが前時代的である。パソコンーインターネット普及での了解は、市井の庶民のささやかな力の総和が、センター集中型の権威的メインフレームシステムを蹴散らしたと言うことであり、このことは周知の事実であろう。

 今日は終戦記念日であるが、過去には、一点豪華主義で実戦で役に立たない時代遅れで金食い虫の巨大戦艦○○や○○を作って、国が沈没した大○○帝国という国があったことは記憶に新しい。頑迷で権威的な老○○者のアナクロは恐ろしいものである。


 今後の科学技術を推し進めて行く
Driving Forceは、1点集中の豪華で巨大な実験設備ではなく、大学や研究所の各研究室にごろごろ転がることになるであろう1ラックで10TFとか50TFのボロ・スパコンである。
 どれだけ研究者なり学生がスパコンを自由に使えるかが勝負であり、ボロであってもパソコンのように自由に使うことができるスパコンの絶対量が必要なのである。それらのボロ・スパコンはヴァーチャル・リアリティ顔負けのヴィジュアライゼーション・ツールにより、安価な高性能万能実験装置となり、今後の科学技術を推進することになるのである。


 グラフィック処理のパイオニア
Ivan SutherlandSketchpadを開発できたのはMITLincoln研究所のWhirlwind/SAGEのおこぼれのTX2を自由に使用出来たからであったことは有名な話である。


 勿論、センター型の巨大実験設備やスパコンが時には必要になるではあろうけれど、その巨大機器を活用するには、ボロ・スパコンを自由に使ったデバッグやトライアル・ランが必須であり、そうした地道な作業を経てこそ、巨大機器を使いこなせるのである。この地道な作業を行える人的層の厚さが「眼に見えない国際競争力」となるのである。


 科学技術行政に携わる、心ある人達には、早やく、この手の科学技術の縁の下の力持ち層の拡大強化・待遇改善に目を向けないと、米国や欧州だけでなく、人海戦術の本家であるご近所様にも追い抜かれてしまうであろうことに、気がついてほしいものである。

 

 

 

NSF (全米科学財団)>

 

http://www.nytimes.com/2007/08/06/technology/06ibm.html?_r=1&adxnnl=1&oref=slogin&ref=business&adxnnlx=1186535832-gp6JDCrdVI8DyJp+sgBqhw

 New York Timesがスパコンの話題を取り上げることは珍しく、何事かと思ったが、何のことは無い、NSFが、誤って、まだ公表すべきでない落札情報をWebサイトに載せてしまったということのようである。
 基本的に、
DARPAHPCプロジェクトのIBMCrayの落札額$244M$250Mが相場になっており、二番煎じのNCSANational Center for Supercomputing Applications)は$200Mと言ったところで、相場は下落気味である。


 
NCSANSFが全米に設置したスーパーコンピューティング・センターの1つで、イリノイ大にアウトソースされている。
 NCSAはマーク・アンドリーセンがインターネットブラウザーのMOSAICを開発した組織として有名であるが、スパコンも結構な数を保持している。
 イリノイ大はプリンストンの
IASInstitute of Advanced Study)コンピュータのコピーマシーンであるORDVACILLIAC-I )を陸軍に納入し、その後、D.スロトニックが並列スパコンの草分けであるILLIAC-IVを開発した大学としても有名である。


 研究所のアウトソーシングは米国では珍しいことではなく、
DoEでも、LLNLUC(カリフォルニア大)に、LANLUC+ベクテル社に、SNL(サンディア)はロッキード・マーティン社に、ANL(アルゴンヌ)はシカゴ大に、ORNL(オークリッジ)はテネシー大にアウトソースされている。

 NSFNCSA以外のコンピューティングセンターはカリフォルニア州のサンディエゴ(UCSD)、ペンシルヴェニア州のピッツバーグ(カーネギーメロン大+ピッツバーグ大+ウェスティング・ハウス社)、ニューヨーク州のイサカにあるコーネル大などにあるが、当該NYTIMESの記事内容では、各センターともイリノイだけと言うことにはご不満のようである。



(日々雑感 (2/2) に続く) 

 

  
Posted by petaflops at 13:33Comments(0)TrackBack(0)