Soccer D.B. BLOG

Watson Analyticsを使用して欧州4リーグの勝点とデータの傾向を調査

2017/08/17 11:02:00

欧州の4リーグ(スペイン、イングランド、イタリア、ドイツ)において、勝点とデータにどのような関係があるのかIBMワトソン・アナリティクス(以下ワトソン)を使って調べてみました。どちらかというと目的はワトソンを使ってみたいというところから始まっていて、最初は自分のサイトのデータを入れてみようと思ったのですが、まずは簡易なデータ量のものから始めたく、今回の記事に至りました。

ワトソンがどういうものかはこちらの公式ウェブサイトをご確認ください。簡単に言うとデータセットから自動的にグラフなどを作ってくれて、傾向分析や予測などもやってくれるとのことです。自分は統計学には強くないのでこういうツールは助かります。今回のデータセットはWhoScoredにあるOptaデータを参照しました。対象リーグから5年分のシーズンの1試合平均値をワトソンに入れました。本来はもっと細かいデータを入れるべきでしょうが、もともと公開されているデータ量や作業時間を考えると厳しいので、シーズンの値で妥協しました。

入れたデータ項目については長くなるので本記事の最後に一覧を載せています。まずはリーグ毎に結果を紹介します。

ワトソンにデータを入れると何を見たいかの候補が出てきます。見たい項目がなければ項目名などで検索をかけます。今回見たいのは「勝点と他のデータの関係」なので、「What drives points?」を選択しました。その後、フィルターをかけることでリーグ毎に結果を見ることができます。

ワトソンアナリティクス開始画面

プレミアリーグ

プレミアリーグ画像1

最初にイングランドのプレミアリーグから。宇宙っぽいグラフと表が出てきました。勝点に関連のあるデータが中央に近い位置となり、strengthが高い数値となります。1項目だけでなく2項目が複合された形でも調べてくれるようです。イングランドの場合、最も高いのは「被シュート(ag_shots)が少なくgoal(得点)が多いチーム」となりました。このデータの詳細を見るとこんな感じ。

プレミアリーグ画像2

2つのデータのそれぞれの範囲内のチームの平均勝点を可視化したグラフのようです。当然被シュートは少ない方が良く得点は多い方が良いですが、プレミアリーグは双方とも揃って良いチームが勝点を得ているようです。この組み合わせに次いで2番目にドリブルと得点、3番目はシュートと得点になりました。僅差ですがシュートよりドリブルの数なんですね。

こんな感じで他のリーグも見ていきます。イタリアのセリエAは下図のようになりました。

セリエA

セリエA画像1
セリエA画像2
セリエA画像3

1番目はポゼッション率とゴール。2番目はファウルとゴール。ファウルは少ない方が良いです。

リーガエスパニョーラ

リーガ画像1

次にスペイン。こちらはちょっと変わった結果に。

「team」というデータが出てきました。これはただのチーム名です。本来外してもよかったのですが、面白いのでこのまま紹介します。詳細グラフを見ると下図が表示されました。

リーガ画像2

簡単にいうとチームをいくつかのグループに分けるとだいたい同じような勝点になるということです。使っているデータは5シーズン分だけなので言われてみればそうかもしれません。ある意味、リーグとしてはあまり面白いとは言えませんが…。

リーガ画像3

他の関与データも近い位置となっています。open_playはオープンプレーからのゴールです。あとショートパスというデータが出てきているのがスペインらしいですね。ag_open_playはオープンプレーからの失点ですので、下の画像だとショートパスが多くオープンプレーからの失点が少ない方が勝点を得ているという傾向です。

ブンデスリーガ

ブンデス画像1

最後はドイツのブンデスリーガ。こちらもteamが出てきましたがスペインのように単独ではなくseasonとのセット。seasonは年号(開幕の年)を入れているだけなので、年の変化とチームに関連があるということのようです。ただ、その後がgoalとteamなので、seasonの影響はそこまで強くないでしょう。goalとseasonのグラフはこちら。

ブンデス画像2

3番目にある「ag_set_piece」はセットプレーからの失点のことです。よってオープンプレーからのゴールが多くセットプレーの失点が少ないチームとなりますね。

ブンデス画像3

簡単ですが以上となります。得点を増やし失点を減らすのは当たり前ですが、その中にも微妙にリーグ間でズレがありましたね。ワトソンの無償利用期間は約1カ月ですので、もう1つJリーグで何かやろうと思います。

※今回ワトソンに入れたデータ
league: リーグ名称
season: 年度
team: チーム名称
points: 勝点
goal: 得点
goal_against: 失点
open_play: オープンプレーからの得点
counter_attack: カウンターからの得点
set_piece: セットプレーからの得点
ag_open_play: オープンプレーからの失点
ag_counter_attack: カウンターからの失点
ag_set_piece: セットプレーからの失点
possession: ボール支配率
aerialswon: 空中戦勝利
ag_shots: 相手のシュート
tackles: タックル
interceptions: インターセプト
fouls: ファウル
shots: シュート
shots_ot: 枠内シュート
dribbles: ドリブル
fouled: 相手のファウル
cross: クロス
through_ball: スルーパス
long_balls: ロングパス
short_passes: ショートパス

最新記事

記事画像
2020/04/05 12:26:00 SoccerD.B.を作った理由
記事画像
2019/02/21 12:17:16 2019Jリーグ主審リスト

掲載年別

タグ別