とあるセルティスタの落書き帳

サッカークラブ、Celta de Vigoについて書きたいことをノホホンと書いていくブログです。管理人は多忙(怠惰)のため、基本的に気が向いた時に集中更新になると思います笑 カードゲームGwentについてもチマチマ書いていきます(´ω`*)

¡Hala Celta!

セルティスタ 兼 Gwentエンジョイ勢のブログ

ラ・リーガで一番「不運な」チームはどこだ??

 

サッカーファンは何かと己のチームの悲運を呪うことが多い(気がする) 。あのシュートが決まっていれば、あの惜しいセーブが成功していれば、あのトンデモゴールが外れていれば…と。

 

しかしホントに、それはアンラッキーだったんだろうか?推しチームが思ったより下位に沈んでるのは、実は「日頃の行い」のせいより実力が反映された結果ではないだろうか?今回はこれをゴール期待値を使って検証してみようと思う。

 

きっかけは仲良くさせてもらってるセルティスタの方のツイートだった


https://twitter.com/sasizumE3695/status/1527839190649430016?s=20&t=nHOrnhBS48YJUCDsHNyR4A

https://twitter.com/sasizumE3695?s=20&t=nHOrnhBS48YJUCDsHNyR4A

このツイートを見て、筆者は違和感を覚えたのである。期待(失)点であるxG(A)の

性質上、積算した値が持つ「1点」の意味は通常の1ゴールとは全く異なるのではないだろうか?確率5%のシュートを20本打ったところで、試合で1点入るわけでは無い。むしろ、確率5%のシュートを20本打っても1点も入らない確率が35%強と3分の1を超えている。これを踏まえると、期待点を単純に足し合わせていった数字は、それ単体ではほとんど意味をなさないのではないだろうか??

 

そこで思いだしたのである。

そーいえば、xGを使ってセルタを題材に大学のレポートを昔書いたなぁと。

 

試しにパソコンの奥底に眠る、見るのも恥ずかしい部分をほじくり返すと律儀にExcelのファイルと共にレポート本文があるではないか!!

という訳で、このレポートの供養も兼ねて今年のデータでも分析してみることを思いたったのである。

 

さてさっそく、本題に入ろう。ゴール期待値をよく知らない人は提出したレポートのイントロに記述したのでそちらを参照されたし。

 

方法はt検定を用いる。ざっくり言うと、平均値から偶然とは思えないほど離れた値なのか?を判定してくれるものである。筆者は統計を専門に勉強した訳では全くないので詳しい事は統計学の教科書でも読んでくだされ笑

 

データは「understats」から持ってきた。そもそもxG等の算出にバラツキがあるので、本来はいくつかのサイトから持ってきたほうが良い気がするが…他にもキレイにまとまってるサイトがあったら教えて下さい笑

 

有意水準は5%として、帰無仮説

リーグ平均値に比べ、チームXの「総xGと総得点数の差」は差が無い

とし、対立仮説を

リーグ平均値に比べ、チームXの「総xGと総失点数の差」は差がある

とした。

 

難しい話をしても筆者のボロが出るだけのような気がするので、さっそく結果をまとめた表を出そう。

結果

 

赤字の部分がリーグ平均に比べて幸運である方の結果、青字は不運である方の結果が出たことを示す。ハイフンはどっちでもない(帰無仮説を棄却できない)ことを示す。

 

さてこの表の中で特徴の強いチームをまとめると、

 

  • 得点も失点も勝ち点もプレー内容の期待より明らかに幸運だったチーム

セビージャ・べティス・エルチェ

  • 全てにおいて順当だったチーム

オサスナ

  • 得点も失点も勝ち点もプレー内容の期待より明らかに不運だったチーム

レバンテ・アラベス

 

当たり前だが、上振れしてるチームほど上位に多い傾向にあり、下位2チームは完全に不運まみれのチームだった。特にレバンテはなかなか酷い。(後述の統計量参照)

 

正直、セルタ以外のチームはシーズン通して追えていないので何ともコメントしづらいのだが・・・エルチェの上振れっぷりは何となく理解できる。セルタでからっきしダメだったボジェが、際どいゴールを量産して勝ち点を積み上げていった気がする。編成も変わるので一概に言えないが、来シーズンのエルチェの動向は検定の正確性を判定してくれるかもしれない。

ちなみに、わが軍・セルタは勝ち点では不運だったものの概ね順当という結果が出た。確かに納得の結果のような気がする。

そして問いの発端であるアトレティコは、失点数が不運寄りということが分かった。今年はオブラクの理不尽セーブが少なかったのかしらん?

 

リーガクラスタの皆さん、この結果を見てどう思いますか??

感想お待ちしております!

反響があったら、他の4大リーグくらいはまとめても良いと思ってますw

(ホントはJリーグでやりたいけど、資料が乏しい・・・)

 

参考1:各種統計量(と独り言)

今回、母集団を「サッカーの試合全体」と仮定して(サッカーのxGAと実数値にはある一定の差が存在すると仮定)標本不偏分散を計算したけれども、もしかしてリーガ20チームを母集団としても問題ない?賢い方、教えてください・・・

 

標本標準誤差(xG) (xGA) (xPts)
1.465329364 1.507865274 1.639800357

やっぱり、xGAのt値においてレバンテの-10がエグイ・・・w

ランダムだった場合、物凄い低確率でしか起こりえない下振れを引いてる・・・

他に目を引くのはソシエダのxGのt値+9。良い攻撃をしてるのに点が全然入っていないようだ。前半戦の首位争いから失速したのは最後の決定力不足??

レアル・マドリーのxGAの上振れはやっぱりクルトワのおかげですかね。

 

参考2:筆者の提出したレポート(一部、年月に関わる部分は改変)

 

1.背景・目的

 筆者の好きなサッカーチームであるReal Club Celta de Vigo(以下、セルタと略)はスペイン北部、ガリシア地方のプロ・サッカーチームである。現在、10年連続でスペイン1部リーグに所属しているが、何度も2部降格の危機に遭っている。特に2018/2019シーズンはシーズンオフに大きな移籍金を払って有力選手を獲得したにも関わらず、降格圏まで勝ち点1差の17位でギリギリ1部残留という結果に終わった。シーズン前の下馬評は高く、上位3分の1に入る可能性が高いとされていた。また、その前の2シーズン連続でスペイン人得点王に輝いているエース(注:もちろんアスパスのこと)も健在であり、残留争いに巻き込まれるという予想はほとんどなかった。しかし実際には、上位陣にも互角の試合をするにも関わらず格下に負ける場面が多く、勝ち点は伸びていかなかった。一ファンからすると理不尽なゴールを決められることやセルタのシュートがポストに当たって外れるなどアンラッキーな場面も多いように見受けられた。

 

 ところで、最近のサッカーでは様々な数値指標が考え出され、分析することが盛んになっている。その数値指標の一つにExpected Goalsと呼ばれるものがある。日本語に訳すなら「ゴール期待値」と訳せる。これは、試合中にゴールに向かって放たれたシュート1本に対して、ゴールになる確率を求めたものである。単にシュートと言ってもペナルティエリアの外から、しかもゴールに対して角度の無いところから放たれたミドルシュートと、ゴール正面の5mからフリーで流し込むだけのシュートではゴールになる確率が異なることは感覚的に分かる。そこで、シュートの放たれた位置や角度から実際に得点になる確率を具体的に導くことが考え出された。実際に計算の元になっているのはサッカー専門の大手データ分析会社『Opta』が欧州主要リーグの全試合・全シュートに関する内訳を細かく分析したデータである。具体的には、シュートが放たれた位置(距離・角度)やシュートの種類(足でのキックかヘディングか等)、ラストパスの種類、直前に行われたプレーの種類、シュートに至るまでのパスの本数、ボールの奪取地点をパラメーター化し「あるシュートが得点につながる確率がどれだけあるか」という期待値を算出している。最も簡単な例を挙げるとすると、ペナルティーキックのExpected Goalsは0.76とされ、76%の確率でゴールになるとされている。

 

 このExpected Goalsを用いれば、1試合に放たれたシュート全ての期待値を積算することで、その試合のチームの得点期待値(以下、xGと略)と失点期待値(以下、xGAと略)を求めることが出来る。さらに、この期待値を元に100000回試合をシミュレートした時に得られる勝ち点の期待値(以下、xPTSと略)も求められている。

 これらの数値指標は2013年にイギリスのスポーツ・アナリティクス愛好家ポール・ライリー氏が自信のブログ「Differentgame」で発表し、ヨーロッパやアメリカで広く広まった。現在では大手のサッカー専門誌が取り上げるなど広く浸透している。

 さて、このxGやxPTSと実際にチームが取ったゴール数や勝ち点の差を比較することで、どれだけ見込まれる得点や勝ち点より離れており、実際に見せたパフォーマンスに比べてどれだけ幸運だったのか、不運だったのかを数値化することが出来ると考えた。サッカーは得点が入りづらく、1点差での決着も多いスポーツである。そして足という手に比べて不自由な体の部位でボールをコントロールすることから不確実な要素が多い。よって結果が「運」に左右されることも多いスポーツだと考える。xGより実際の得点が多いならば、そのチームは実力以上にゴールが決まりラッキーだったと考えることが出来る。またxGAが実際の失点よりも多いならば、実力以上に失点が少なくラッキーだったと考えられる。今回は2019/2020シーズンのセルタが本当に実力よりも低い結果であり、不運なチームだったのかを検証するために分析を行う。

 

2.方法

 自らの手でxG等を求めるのは非常に難しいので、今回は「understats」というサイトの数値を参考にした。

 2018/2019シーズンのスペイン1部リーグの全チームの総xGと総得点数の差、総xGAと総失点数の差、総xPTSと勝ち点の差を調べ、各平均値とセルタの各値についてt検定を行った。

(注:t検定はデータの数が100より少ない時に使う検定方法。詳しくは統計学の教科書で勉強してくれ!)

 

3.結果
 

xGの差

xAの差

xPTSの差

平均値

1.54

1.5385

0.5245

       

標本不偏分散

28.97470526

37.86381342

50.88204711

       

セルタの偏差

1.9

-5.7085

9.7355

標本標準誤差

1.20363419

1.375932655

1.595024249

検定統計量t

1.5785527

-4.14882224

6.10366896

 

「総xGと総得点数の差」のリーグ平均値とセルタの「総xGと総得点数の差」について有意水準5%で検定を行う。

帰無仮説H0:リーグ平均値に比べ、セルタの「総xGと総得点数の差」は差が無い

対立仮説H1:リーグ平均値に比べ、セルタの「総xGと総得点数の差」は差がある

とすると検定統計量tは1.5785527。t分布表から棄却限界域R=2.093よりR>|t|であるからH0は棄却出来ない。よって、「総xGと総得点数の差」のリーグ平均値とセルタの「総xGと総得点数の差」について有意な差は見られない。

 

次に「総xGAと総失点数の差」のリーグ平均値とセルタの「総xGAと総失点数の差」について有意水準5%で検定を行う。

帰無仮説H0:リーグ平均値に比べ、セルタの「総xGAと総失点数の差」は差が無い

対立仮説H1:リーグ平均値に比べ、セルタの「総xGAと総失点数の差」は差がある

とすると

検定統計量tは-4.14882224。t分布表から棄却限界域R=2.093よりR<|t|であるからH0は棄却出来る。よって、「総xGAと総失点数の差」のリーグ平均値とセルタの「総xGAと総失点数の差」について有意な差が見られる。

 

さらに「総xPTSと勝ち点の差」のリーグ平均値とセルタの「総xPTSと勝ち点の差」について有意水準5%で検定を行う。

帰無仮説H0:リーグ平均値に比べ、セルタの「総xPTSと勝ち点の差」は差が無い

対立仮説H1:リーグ平均値に比べ、セルタの「総xPTSと勝ち点の差」は差がある

とすると

検定統計量tは6.10366896。t分布表から棄却限界域R=2.093よりR<|t|であるからH0は棄却出来る。よって、「総xPTSと勝ち点の差」のリーグ平均値とセルタの「総xPTSと勝ち点の差」について有意な差が見られる。

 

 

4.考察

 総xGAと総失点数の差の検定からセルタはリーグ平均値よりもパフォーマンスに見合っていないアンラッキーな失点が有意に多いことが分かった。これは、相手に良い位置・良い展開でシュートを打たせないようにしているにも関わらずゴールを決められてしまっているということである。

 

Expected Goalsでは個々のゴールキーパーの能力をパラメーター化していない。そのため総xGAと総失点数の差は、そのチームの1年を通じたゴールキーパーの能力ともいえる。ゴールになる確率が高いシュートを沢山ゴールキーパーが止める・もしくは外させることが出来れば、総xGAと総失点数の差の値は正の値を取る。(注:ようは試合内容から期待される失点より実際の失点の方が少ない、ということ。)その証拠として、現スペイン代表の正GKを務めるウナイ・シモンが38試合中34試合出場したアスレチックス・ビルバオは+14.42と非常に大きい値を取っており、同じくベルギー代表で正GKを務めるティボー・クルトワが38試合中34試合出場したレアル・マドリーも+8.15と大きい値を取っている。またリーグの標本不偏分散がxGの差と比べてxGAの差の方が大きいことからも、ゴールキーパーという個人が大きくxGAの差に関与していることが伺える。(注:異論はあると思う笑)

 

このシーズンのセルタのゴールキーパーは、シーズン最終盤に正GKとサブのGKがどちらも怪我をするという緊急事態に襲われていた。アンラッキーな形の失点が多かっただけでなく、GKの能力が見劣りしていた点もxGAと実際の失点の値の差に繋がっているかもしれない。(注:アルバレスとルベンが両方怪我をしたシーズン。)

 

一方、xGと総得点の差の検定からはセルタはリーグ平均値と有意水準5%では有意な差が見られなかった。これは、パフォーマンスから期待される得点数通り、得点を取っており幸運とも不運ともいえない。

一方でxPTSと勝ち点の差の検定からセルタは勝ち点を取りこぼしている点数がリーグ平均よりも有意に多いことが分かった。良い試合をしているにも関わらず、勝ち点に反映されないことが多かったということが考えられる。サッカーの勝ち点によって順位を付ける方法では勝つと3点、引き分けると1点しかもらえず、勝つことの価値が高く設定されている。このシーズンのセルタは引き分けが多かった。(注:引き分けの数が16とリーグトップタイであった)1回勝った分の勝ち点は3回引き分けなければ得ることが出来ないため、優勢だったにも関わらず引き分けてしまうとxPTSと実際の勝ち点の差が大きく開いていくことが考えられる。そのため、このシーズンのセルタはしぶとく戦って引き分けが多かったというよりも、勝ちきれずに引き分けが多くなってしまったと考えられる。つまりアンラッキーな引き分けが多かったと考えられる。(注:引き分けが負け、よりも、勝ちが引き分けになってしまうほうが勝ち点に与える影響が多いということから推察。)

 

以上より、2019/2020シーズンのセルタはGKの力不足や不運な形での失点が多く、優勢な試合でも引き分けてしまったため下位に沈んでしまったと考えられる。そして実際のパフォーマンスには見合わない結果だった不運なチームだったと言える。

 

参考文献

「understat」

https://understat.com/league/La_liga/2019

 

「進化型サッカー評論❹ゴール期待値「ExpG」」

片野道郎 footballista

2016年7月13日

https://www.footballista.jp/special/31762

 

「The good, the bad, and the unlucky: What Expected Points tell us about the 2018 MLS season」

AMERICAN SOCCER ANALYSIS

2018年8月15日

https://www.americansocceranalysis.com/home/2018/8/14/the-good-the-bad-and-the-unlucky-what-xpoints-tells-us-about-the-2018-mls-season

 

「サッカーの見方が広がるかも…? 『勝ち点期待値』から見るプレミアリーグの順位」

Footmedia SOCCERKING

2019年10月23日

https://www.soccer-king.jp/news/world/eng/20191023/991497.html