Uncovering the Background-Induced bias in RGB based 6-DoF Object Pose Estimation

要約

タイトル:RGBベースの6自由度物体姿勢推定における背景誘起バイアスの解明

要約:

– 近年、産業分野においてデータ駆動型の手法が増加しています。
– このような手法はビデオ画像や部品を処理することが多く、その画像の完全性が重要です。
– データセットが複雑である場合、画像の操作が機械学習方法の有効性にどのように影響するかを理解することは重要です。
– この論文は、6Dポーズ推定の文脈で最先端とされるLinemodデータセットを分析することを目的としています。
– このデータセットは、ArUcoマーカーの付いた画像があり、これらのマーカーは現実世界では使用できないため、マーカーの存在がポーズ推定の正確さにどのように影響するかを分析します。
– 特に、サリエンシーマップのツールを使用して、ニューラルネットワークの焦点がこれらのArUcoマーカーによって一部キャプチャされることを示します。
– 最後に、Linemodに幾何学的ツールを適用して得られた新しいデータセットを提案し、バイアスを解明します。
– この研究結果は、6自由度ポーズ推定ネットワークにバイアスがあり、マーカーのトレーニングを行う場合にはこのバイアスを軽減する方法が提案されています。

要約(オリジナル)

In recent years, there has been a growing trend of using data-driven methods in industrial settings. These kinds of methods often process video images or parts, therefore the integrity of such images is crucial. Sometimes datasets, e.g. consisting of images, can be sophisticated for various reasons. It becomes critical to understand how the manipulation of video and images can impact the effectiveness of a machine learning method. Our case study aims precisely to analyze the Linemod dataset, considered the state of the art in 6D pose estimation context. That dataset presents images accompanied by ArUco markers; it is evident that such markers will not be available in real-world contexts. We analyze how the presence of the markers affects the pose estimation accuracy, and how this bias may be mitigated through data augmentation and other methods. Our work aims to show how the presence of these markers goes to modify, in the testing phase, the effectiveness of the deep learning method used. In particular, we will demonstrate, through the tool of saliency maps, how the focus of the neural network is captured in part by these ArUco markers. Finally, a new dataset, obtained by applying geometric tools to Linemod, will be proposed in order to demonstrate our hypothesis and uncovering the bias. Our results demonstrate the potential for bias in 6DOF pose estimation networks, and suggest methods for reducing this bias when training with markers.

arxiv情報

著者 Elena Govi,Davide Sapienza,Carmelo Scribano,Tobia Poppi,Giorgia Franchini,Paola Ardòn,Micaela Verucchi,Marko Bertogna
発行日 2023-04-17 12:54:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV, I.2.10 パーマリンク