前回は、「マイナーとメジャー」、あるいは、「日本とメジャー」というように、違ったリーグ間での成績を同じ土俵に乗せて比較する「ダベンポート変換」について紹介した。

ダベンポート変換は、空間を超えて、あるいは、過去にさかのぼって成績を比較するのに適した方法であるが、今回は、「ある選手の未来の成績」を予測する手法である「PECOTA」について紹介しよう。

PECOTAは「Player Empirical Comparison and Optimization Test Algorithm」の略とされているが、このフルネームは後からこじつけたもので、本当のところは198694年にメジャーでプレーした「ビル・ペコタ」の名を拝借したのが名前の始まりだったと言われている。

PECOTAが発表されたのは2003年。考案者は、当時野球シンクタンク「Baseball Prospectus」に在籍したネイト・シルバーだった。PECOTAによる「成績予測値」は、毎年キャンプ開始時になると有料で公表され、同シンクタンクの貴重な商品となっている(PECOTAのデータにアクセスするには、「Baseball Prospectus」をオンライン購読するか、毎年シーズン前に発行される同名書を購入するかの二つの方法がある)

実は、コンピュータ予想システムはPECOTA以外にもいくつかあるのだが、なぜ予想システムがこうも氾濫するかというと、その最大の理由は「ファンタジー・ベースボール」というゲームがファンの間で大流行していることにある。

ファンタジー・ベースボールについて書き出したらきりがないのだが、簡単に説明すると、ゲーム参加者が「オーナー兼GM」となって仮想のリーグを結成。現実に進行するシーズンと連動させた「所属」選手の成績に基づいて所有チームの勝敗を競う、というものである。

開幕直前に参加者間で「ドラフト」を実施、仮想チームを編成するのだが、ファンタジー・ベースボールは「賭け」として行われるケースがほとんどなので、賭けた金を失いたくなかったら、ドラフト時に「今季活躍すると予測される選手をたくさん獲得する」ことが重要となる。ファンタジー・ベースボールで強いチームを編成するという目的の下に、PECOTA等のコンピュータ予想データが重宝されるようになったのである。

PECOTA考案者のシルバーは、最近は野球だけでなく「選挙予想」も手がけている。特に、2008年、オバマが当選した選挙では、予想をことごとく的中させ、全米メディアの注目を浴びた。たとえば、大統領選について、得票率は「オバマ52.3%対マケイン46.2%」と予想したところ、結果は「オバマ52.5%対マケイン46.2%」と、オバマの得票率をわずか0.2%間違えただけであったし、上院議員選挙ではなんと予測した35の州で当選者すべてを一人の狂いもなく的中させたのである。野球という複雑なゲームを予想することに比べたら、選挙の予想など、「お茶の子さいさい」だったようである。

さて、PECOTAのデータ算出法であるが、その基礎となるアイディアは、「成績がよく似た過去の選手と比較することである選手の未来を予測する」ことにある。

ここで、松井秀喜を例に取って説明しよう。松井の2006-2009年(33-35歳)、3年間の成績を見たとき、第二次大戦以後プレーした全選手の中で、33-35歳の成績がもっともよく似ていたのは、ハロルド・ベインズ、クリフ・フロイド、エディー・マシューズ、グース・ゴスリン、…etcといった顔ぶれであった。こういった松井と似通った成績を残した選手達が36歳の時にどういう成績を残したかを見て、松井の2010年(36歳)の成績を予測するのである。

以下、主な日本人選手について、2010年のPECOTA予測値を紹介する。なお、ダベンポート変換することで(=メジャーと共通の土俵に乗せることで)日本時代の成績もPECOTAのシステムに乗せることができるので、メジャーでプレーしたことのない選手の成績も予測値が出てくる仕組みとなっている。

<打者>
              打率 出塁率 長打率 本塁打 打点 EqA 
イチロー   .317   .364    .414       7        42   .272
松井秀喜   .277   .362    .475      16       59   .278
松井稼頭央 .280  .339    .415       7        33   .261
福留孝介   .264   .382    .394       9        48   .267
岩村明憲   .273   .361    .392       7        32   .256    

<投手>
              勝 敗 防御率 三振 WHIP
松坂大輔   11   8    4.08    155    1.39
黒田博樹   10   9    3.96    109    1.25
上原浩治    9    7    4.26    106    1.24
川上憲伸   10   9    3.91    124    1.31
高橋尚成    8    9    4.72    112    1.43