要約
チェス認識とは、チェス盤の画像からチェスの駒の構成を識別するタスクを指します。
チェス盤の検出、正方形の位置特定、駒の分類のパイプラインを通じてこのタスクを解決することを目的とした主流のアプローチとは対照的に、私たちは深層学習モデルの力に依存し、このパイプラインを回避してチェス盤の構成を直接予測するための 2 つの新しい方法論を導入します。
全体のイメージ。
そうすることで、逐次的なアプローチに固有のエラーの蓄積と中間の注釈の必要性を回避します。
さらに、チェス認識用に特別に設計された、10,800 枚の画像とそれに対応する注釈で構成される新しいデータセットである Chess Recognition Dataset (ChessReD) を導入します。
角度が制限された既存の合成データセットとは対照的に、このデータセットは、スマートフォンのカメラを使用してさまざまな角度からキャプチャされたチェスの陣形の実際の画像の多様なコレクションで構成されています。
現実世界への適用性を確保するためにセンサーを選択しました。
このデータセットは、モデルのトレーニングとそのパフォーマンスの評価および現在の最先端のパフォーマンスとの比較の両方に使用されます。
この新しいベンチマーク データセットでのチェス認識における私たちのアプローチは、関連するアプローチよりも優れており、15.26% のボード認識精度 (現在の最先端のものより約 7 倍優れています) を達成しています。
要約(オリジナル)
Chess recognition refers to the task of identifying the chess pieces configuration from a chessboard image. Contrary to the predominant approach that aims to solve this task through the pipeline of chessboard detection, square localization, and piece classification, we rely on the power of deep learning models and introduce two novel methodologies to circumvent this pipeline and directly predict the chessboard configuration from the entire image. In doing so, we avoid the inherent error accumulation of the sequential approaches and the need for intermediate annotations. Furthermore, we introduce a new dataset, Chess Recognition Dataset (ChessReD), specifically designed for chess recognition that consists of 10,800 images and their corresponding annotations. In contrast to existing synthetic datasets with limited angles, this dataset comprises a diverse collection of real images of chess formations captured from various angles using smartphone cameras; a sensor choice made to ensure real-world applicability. We use this dataset to both train our model and evaluate and compare its performance to that of the current state-of-the-art. Our approach in chess recognition on this new benchmark dataset outperforms related approaches, achieving a board recognition accuracy of 15.26% ($\approx$7x better than the current state-of-the-art).
arxiv情報
著者 | Athanasios Masouris,Jan van Gemert |
発行日 | 2023-10-06 08:30:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google