最近は、チームがデータをどうやって使ってるのかなと気になり、
ただ、そんなチームの戦術の肝となるようなところは公開されておらず、
データもないので、どうしようかと悩んだところ・・・、
スポーツ×データの論文が結構出てるみたいなので、読んでみることにしました。概要のみですが・・・。
ということで第一弾。
タイトル
PlayeRank: data-driven performance evaluation and player ranking in soccer via a machine learning approach
https://arxiv.org/pdf/1802.04987.pdf
要は、PlayeRankというデータドリブンで選手を評価するフレームワークを作りましたよという論文。
背景
昨今多くのメディアがあるけど、どっちかというとファン向けの分析が多く。一方で、監督やコーチはデータで客観的に判断できたら嬉しいけど、すごく時間かかってしまうよね・・・。
という課題から今回の研究がスタートしたようです。
使用データ
Wyscout社のデータセット。
Wyscoutさんのデータが使えるとか、もう羨ましすぎる。
プレーパフォーマンス
タグづけされたプレーを選手ごとにベクトル化し、SVM(分類手法)を使ってプレーのベクトルと勝敗結果を分類。
分類モデルの変数寄与度を使ってパフォーマンスを評価。
選手をクラスタリング
選手の平均プレー位置をクラスタリングし、以下8つに分類
C1: right fielder( plays on the right side of the field as a wing back or both)
C2: central forward( plays in the center of the field close to the opponent’s area)
C3: central fielder( plays in the center of the field)
C4: left fielder( plays on the left side of the field as a wing back or both)
C5: left central back( plays close to his own goal preferably on the left)
C6: right forward( plays on the right side of the field close to the opponent’s area)
C7: right central back( plays close to his own goal preferably on the right)
C8: left forward( plays on the left side of the field close to the opponent’s area)
つまり、、、
8つにクラスタリングした選手に対し、それぞれのパフォーマンスを評価してみてみた。
ポイントは、、、、
1.選手のクラスタリングに平均プレー位置を用いたこと。
最近は今までと違ってポジションによって求められるプレーが違うけど、
プレー位置はやはりある程度固定されてるんだと思われる。位置が固定されていない方が相手にとっては戦いにくいけど、反面組織としての連携は難しくなるんだろうな。
2.プレーと勝敗の関連性に分類予測を用いたところ
グラフも多いし、RELATED WORKSも結構載ってて面白いので興味ある方は是非見て見てください。
※論文も読み慣れているわけではなく英語も得意なわけではないので、間違い等ありましたらご指摘お願いします。