要約
操作から自動運転車までのアプリケーションは、動的環境でタスクを安全に実行するために、堅牢で一般的なオブジェクト追跡に依存しています。
我々は、既知のカテゴリの物体 (例: 車) の形状推定と姿勢追跡を同時に行うための、最初の証明可能で最適なカテゴリレベルのアプローチを提案します。
私たちのアプローチは、RGB-D 画像シーケンスから抽出された 3D セマンティック キーポイント測定を使用し、推定を固定ラグ平滑化問題として表現します。
時間的制約により、オブジェクトの剛性 (形状が固定) と、一定のねじれ運動モデルに従って滑らかな動きが強制されます。
この問題の解決策は、平滑化範囲にわたるオブジェクトの状態 (姿勢、速度) と形状 (アクティブな形状モデルに従ってパラメーター化された) を推定することです。
私たちの主な貢献は、固定ラグ平滑化問題の非凸性にもかかわらず、小さなサイズの半定値緩和を使用して、証明可能な最適性まで問題を解決できることを示したことです。
また、形状と時間の互換性テストを使用して誤ったキーポイント検出を除外する高速外れ値拒否スキームも提示し、段階的非凸性スキームで認定可能なソルバーをラップします。
提案されたアプローチを合成データと実際のデータで評価し、卓上操作シナリオとドローンベースの車両追跡アプリケーションでのパフォーマンスを示します。
要約(オリジナル)
Applications from manipulation to autonomous vehicles rely on robust and general object tracking to safely perform tasks in dynamic environments. We propose the first certifiably optimal category-level approach for simultaneous shape estimation and pose tracking of an object of known category (e.g. a car). Our approach uses 3D semantic keypoint measurements extracted from an RGB-D image sequence, and phrases the estimation as a fixed-lag smoothing problem. Temporal constraints enforce the object’s rigidity (fixed shape) and smooth motion according to a constant-twist motion model. The solutions to this problem are the estimates of the object’s state (poses, velocities) and shape (paramaterized according to the active shape model) over the smoothing horizon. Our key contribution is to show that despite the non-convexity of the fixed-lag smoothing problem, we can solve it to certifiable optimality using a small-size semidefinite relaxation. We also present a fast outlier rejection scheme that filters out incorrect keypoint detections with shape and time compatibility tests, and wrap our certifiable solver in a graduated non-convexity scheme. We evaluate the proposed approach on synthetic and real data, showcasing its performance in a table-top manipulation scenario and a drone-based vehicle tracking application.
arxiv情報
著者 | Lorenzo Shaikewitz,Samuel Ubellacker,Luca Carlone |
発行日 | 2024-12-05 22:23:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google