要約
サッカーのアクションシーンを理解することは、ゲームの複雑かつダイナミックな性質、および選手間の相互作用のため、困難な作業です。
この記事では、使用されるモダリティとマルチモーダルな手法に特に重点を置きながら、アクション認識、スポッティング、時空間的アクションの位置特定に分けてこのタスクの包括的な概要を説明します。
モデルのパフォーマンスを評価するために使用される、公開されているデータ ソースと指標を調査します。
この記事では、深層学習技術と従来の手法を活用した最近の最先端の手法をレビューします。
私たちは、ビデオやオーディオ データなどの複数のソースからの情報を統合するマルチモーダルな手法と、1 つのソースをさまざまな方法で表す手法に焦点を当てています。
手法の利点と限界について、モデルの精度と堅牢性を向上させる可能性とともに説明します。
最後に、この記事では、この分野を前進させるためのマルチモーダル手法の可能性など、サッカー動作認識分野における未解決の研究課題と将来の方向性のいくつかを強調しています。
全体として、この調査はサッカーのアクションシーン理解の分野に興味のある研究者にとって貴重なリソースを提供します。
要約(オリジナル)
Action scene understanding in soccer is a challenging task due to the complex and dynamic nature of the game, as well as the interactions between players. This article provides a comprehensive overview of this task divided into action recognition, spotting, and spatio-temporal action localization, with a particular emphasis on the modalities used and multimodal methods. We explore the publicly available data sources and metrics used to evaluate models’ performance. The article reviews recent state-of-the-art methods that leverage deep learning techniques and traditional methods. We focus on multimodal methods, which integrate information from multiple sources, such as video and audio data, and also those that represent one source in various ways. The advantages and limitations of methods are discussed, along with their potential for improving the accuracy and robustness of models. Finally, the article highlights some of the open research questions and future directions in the field of soccer action recognition, including the potential for multimodal methods to advance this field. Overall, this survey provides a valuable resource for researchers interested in the field of action scene understanding in soccer.
arxiv情報
著者 | Karolina Seweryn,Anna Wróblewska,Szymon Łukasik |
発行日 | 2023-09-21 13:36:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google