Soccer D.B. BLOG

サッカーのデータについて思うこと

2018/05/05 22:00:00

ブログリニューアル後の最初の記事ということで、大きいテーマを扱ってみようと思います。Soccer D.B.は名前の通りサッカーのデータベースサイトなのですが、サッカーにおけるデータについて、自分なりに考えをまとめてみました。

大きく2種類に分かれると思っています。1つは「遊ぶため」のデータ。もう1つは「試合に勝つため」のデータです。まず前者について書きます。

試合前のインタビューなどで質問者から監督、選手へ過去の対戦成績について言及した際、だいたいは「関係ない」と返ってくることが多いです。実際のところ、昔に遡れば監督も選手も違うわけで、その当時に積み重なった成績が現時点のメンバーの試合に影響することはありません。でもなぜか同じような傾向が続いたりするのがまた面白いところです。そして関係ないと思いつつも性格によっては気になったりする人もいると思います。

自分のサイトは公式サイトにある試合記録を色々と紐付けるというコンセプトでやっていますので、対チームだけではなく、監督だったり主審別の成績も載せています。はっきり言って割とどうでもいいデータだと思っていますが、それでもこうやって記録化されると新しい楽しみ方も生まれますし、サッカーのデータへの入り口としても重要だと思っています。多くのデータを扱うOptaの日本語ツイッターアカウント「OptaJiro」もどちらかいうとこちらの領域。ボールタッチに関わるデータは「試合に勝つため」のデータとしても使われますが、OptaJiroはアナリストというよりはナビゲーターと言いますか、ライトな層でも分かりやすいデータを紹介し、楽しみ方を増やす役割を果たしているという印象です。

もう一方の「試合に勝つためのデータ」について。こちらはボールタッチや選手の動きそのもののデータ化の話です。サッカーはデータ化しにくいスポーツと言われていましたが、今の時代においてそれはないと思っています。全てのボールタッチとポジショニングが記録され、まだ直接的にサッカー界で活用されているかは分かりませんが、視界やメンタル状態さえも少しずつデジタルデータに置き換わるようになってきました。

問題はその次のステップ。サッカーで起きた事象に対するデータ表現かと思っています。例えばサッカーにおいて「シュート」という事象は多くの方が想像できると思います。先日の神戸vs川崎の試合のシュート数を下に並べました。

神戸vs川崎のシュート数

神戸vs川崎のシュート数

上の表以外にもデータを持つ会社はありますが、確認できたものだけ載せています。データの活用が増えデータを取り扱う会社も増えてきました。12月に行われたE-1でも4,5社のボールタッチデータを見かけました。データというのは当然「◯◯(言葉)の数は●●(数値)」と紹介されるわけですが、この◯◯の部分がサッカーの場合人によって考え方ずれており、同一の事象でも同一と定義されないのです。これは最近戦術の好きな方の間で話されているプレーの言語化にも通ずるところがあると思います。最も分かりやすいシュートですら1試合でずれるのですから、他のプレーはさらに差異があるでしょう。よってサッカーのデータ分析の場合、数学的な分析力はもちろんのことですが、まずはその◯◯がどうカウントされたかという定義を説明する力が必要になります。多くのデータ会社が出てきましたが、ここを説明できないところのデータはあまり信用できないかもしれませんね。曖昧な定義の上で蓄積されたわけですし。

ちなみにJリーグ公式のシュートの定義は以前販売されていた公式記録集にあります。全体的に日本の大会はシュート数(公式のもの)が少なめなのですが、大きく外れたシュートやブロックされたものを省いておりカウントしていないのが理由かと推測できます。

Jリーグのシュート定義

Jリーグのシュート定義

以前スプリントのデータについてブログで書きましたが(スプリント回数を安易に他の大会と比較するのは危険)、同じデータ名称でもデータ会社によって全く異なる数値になりますから、データ名称が同じだからといって単純な数値比較をしてしまうのはミスリードになってしまう可能性があります。裏側を知るのは難しいですが、データ会社が確実ではない場合は同じ大会間での比較が無難かなと思っています。

またスプリントについてはこういう意見もあります。
河森直紀氏のブログ「球技系スポーツの試合中のスプリント数を自動で数えるとか言ってるシステムのほとんどが間違っている
ストレングス&コンディショニングコーチということで、専門で働いているからこそ細かい部分が気になるのでしょう。実際には加速や減速といったデータも取れているでしょうから、分析内容によってはそこも加味する必要がありますね。

全公開される日が来るのか分かりませんが、今はトラッキングやGPSにより全選手の位置と動きを取れるようになっているので、戦術系の方がよくやっているようなシーン解説もデータから再現できることができるはずです。ああいった解説は一つのシーンを選んで行われていますが、データ化されていればあらゆる試合から抽出できるようになります。実際に海外の主要クラブが使用しているプロゾーンなどを扱っているスタッツ社ではそういったアプリがあるようです。
STATS Edge

プレーのカウント方法がどうであれ、選手とボールの「座標」と動く「方向」、動く「速度」は確実に定義されたデータなので齟齬は生まれません。問題は試合の「状況」をどう定義化するのかという点でしょうか。サッカーの1試合の中では様々な状況があり、それぞれ見るべき項目が異なりますからね。1試合の合計値は多くの状況下が全てミックスされたデータですので、試合全体のボール支配率や走行距離といったデータはほとんど意味がありません。ただ、その数値の差異や変化が、深い分析への入り口となることはもちろんあるでしょう。

こういったポジショニングのデータも使用した分析は日本では少ないですが、欧州ではチラホラ増えています。TH氏のブログ(FourThreeThree フットボール統計学)でたまに海外の分析などが紹介されていますので興味がある方はどうぞ。メディアではフットボリスタが一番取り扱ってくれている印象です

サッカーのデータに対してファンが好き嫌いの反応を示すのは何の問題もないと思います。メディアも両論あって良いでしょう。ただ現場の「データ嫌い」はもう許されない時代に入っていると思います。人間は記憶という媒体に蓄積された経験をもとに行動の判断を決めます。データが嫌いな人も経験則は活用しています。つまり記憶に残されたデータを使用しているわけです。ただ記憶というものは曖昧なもので、全てを覚えることはできませんし、時間の経過とともの都合よく改ざんできてしまいます。例えるなら出来の悪いデータ会社に頼っていることになります。それに加えその内容を正しく言語に落とし選手に伝える能力も必要です。そうなると優秀な人間は限られてくるでしょうし、少なくともデータの保管に関しては記憶に頼る必要はないと思います。

とはいえデータを使うとなった場合、記録するアプリケーション、保管する媒体、処理をするプログラム、言葉や絵で出力する能力が必要になります。さすがに監督やコーチがここまでに至るのは大変でしょう。それもあり最近はデータサイエンティストと呼ばれる職の方がいるようですね。統計学の知識やデータベース言語を取り扱うスキルを持っていると思いますが、サッカーの場合はこれらに加え、「データベース言語とサッカー言語(プレーや状況)の翻訳」というスキルも必要になると思います。これがないと監督、コーチに伝わりません。逆に監督、コーチがサッカー言語を正しく説明できないとデータサイエンティストに伝わらず、意味のあるデータが出せなくなる可能性があります。

今現在サッカーにおいてデータ単体で全ての答えを表しているものは、試合のスコアとそれに基づいて作られる順位表だけしかありません。しかしながら複合的にデータを使うことであらゆる可能性を秘めており、特に欧州ではその可能性が少しずつ現実なものとして進化しています。とはいえ欧州からの発信物を見るとまだデータは「手段」の一つとして取り扱っているように思います。僕は最終的に「手段」ですらなくなるレベルに達すると思っていますが、そこに至るまでの過程に生まれそうな人間vsAIがどのような対峙となるのか楽しみです。

大きいことを書きましたが、最初に書いた通りSoccer D.B.は公式記録をベースに作っているサイトですので、今後も遊べるデータを提供できればと思っています。最後まで読んで頂き、ありがとうございました。

最新記事

記事画像
2020/04/05 12:26:00 SoccerD.B.を作った理由
記事画像
2019/02/21 12:17:16 2019Jリーグ主審リスト

掲載年別

タグ別