Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks

要約

サッカー分析は、2つのデータソースに依存しています。プレーヤーがピッチ上の位置と、実行するイベントのシーケンスです。
ゲームごとに約2000のボールイベントがあるため、単眼のビデオストリームに基づいた正確で徹底的な注釈が退屈で費用のかかる手動のタスクです。
最先端の空間的アクション検出方法は、このタスクを自動化するための約束を示していますが、ゲームの文脈的理解が欠けています。
プロのプレイヤーの行動が相互依存していると仮定すると、ポジション、速度、チームメンバーシップなどの周囲のプレイヤーの情報を組み込むことで、純粋に視覚的な予測を強化できると仮定します。
グラフニューラルネットワークを介して視覚的な状態情報とゲーム状態情報を組み合わせた空間的アクション検出アプローチを提案します。

要約(オリジナル)

Soccer analytics rely on two data sources: the player positions on the pitch and the sequences of events they perform. With around 2000 ball events per game, their precise and exhaustive annotation based on a monocular video stream remains a tedious and costly manual task. While state-of-the-art spatio-temporal action detection methods show promise for automating this task, they lack contextual understanding of the game. Assuming professional players’ behaviors are interdependent, we hypothesize that incorporating surrounding players’ information such as positions, velocity and team membership can enhance purely visual predictions. We propose a spatio-temporal action detection approach that combines visual and game state information via Graph Neural Networks trained end-to-end with state-of-the-art 3D CNNs, demonstrating improved metrics through game state integration.

arxiv情報

著者 Jeremie Ochin,Guillaume Devineau,Bogdan Stanciulescu,Sotiris Manitsaris
発行日 2025-02-21 13:41:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク