Explore Contextual Information for 3D Scene Graph Generation

要約

3D シーン グラフ生成 (SGG) は、コンピューター ビジョンで高い関心を集めています。
大まかな分類と単一の関係ラベルに関する 3D SGG の精度は徐々に改善されていますが、既存の作業のパフォーマンスは、細粒度のマルチラベルの状況ではまだ完全ではありません。
このホワイト ペーパーでは、3D SGG タスクのコンテキスト情報を完全に調査するフレームワークを提案します。このフレームワークは、きめの細かいエンティティ クラス、複数の関係ラベル、および高精度の要件を同時に満たそうとします。
私たちの提案するアプローチは、グラフ特徴抽出モジュールとグラフ文脈推論モジュールで構成され、適切な情報冗長特徴抽出、構造化組織、および階層的推論を実現します。
私たちのアプローチは、3DSSG データセット、特に関係予測サブタスクで、以前の方法よりも優れた、または競争力のあるパフォーマンスを達成します。

要約(オリジナル)

3D scene graph generation (SGG) has been of high interest in computer vision. Although the accuracy of 3D SGG on coarse classification and single relation label has been gradually improved, the performance of existing works is still far from being perfect for fine-grained and multi-label situations. In this paper, we propose a framework fully exploring contextual information for the 3D SGG task, which attempts to satisfy the requirements of fine-grained entity class, multiple relation labels, and high accuracy simultaneously. Our proposed approach is composed of a Graph Feature Extraction module and a Graph Contextual Reasoning module, achieving appropriate information-redundancy feature extraction, structured organization, and hierarchical inferring. Our approach achieves superior or competitive performance over previous methods on the 3DSSG dataset, especially on the relationship prediction sub-task.

arxiv情報

著者 Yuanyuan Liu,Chengjiang Long,Zhaoxuan Zhang,Bokai Liu,Qiang Zhang,Baocai Yin,Xin Yang
発行日 2022-10-12 14:26:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク