要約
古典的な視覚的同時ローカリゼーションおよびマッピング (SLAM) アルゴリズムは、通常、環境が固定されていることを前提としています。
この仮定は、移動するオブジェクト (車、自転車、歩行者など) を含む現実のシーンでカメラの姿勢と世界構造を正確に推定できないため、これらのアルゴリズムの適用性を制限します。
この問題に取り組むために、環境内の動的オブジェクトを追跡できるセマンティック、動的、およびステレオ SLAM システムである TwistSLAM を提案します。
私たちのアルゴリズムは、セマンティック クラスに従ってポイントのクラスターを作成します。
機械的ジョイント (セマンティック クラスの関数) によってモデル化されたクラスター間制約の定義のおかげで、新しい制約付きバンドル調整により、移動オブジェクトのポーズと速度の両方を、従来の世界構造とカメラの軌跡と共に共同で推定できます。
パブリック KITTI データセットのいくつかのシーケンスでアプローチを評価し、最先端のアプローチと比較してカメラとオブジェクトの追跡が改善されることを定量的に示します。
要約(オリジナル)
Classical visual simultaneous localization and mapping (SLAM) algorithms usually assume the environment to be rigid. This assumption limits the applicability of those algorithms as they are unable to accurately estimate the camera poses and world structure in real life scenes containing moving objects (e.g. cars, bikes, pedestrians, etc.). To tackle this issue, we propose TwistSLAM: a semantic, dynamic and stereo SLAM system that can track dynamic objects in the environment. Our algorithm creates clusters of points according to their semantic class. Thanks to the definition of inter-cluster constraints modeled by mechanical joints (function of the semantic class), a novel constrained bundle adjustment is then able to jointly estimate both poses and velocities of moving objects along with the classical world structure and camera trajectory. We evaluate our approach on several sequences from the public KITTI dataset and demonstrate quantitatively that it improves camera and object tracking compared to state-of-the-art approaches.
arxiv情報
著者 | Mathieu Gonzalez,Eric Marchand,Amine Kacete,Jérôme Royan |
発行日 | 2022-09-26 17:11:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google