I.2.10」カテゴリーアーカイブ

Learning 3D object-centric representation through prediction

要約 人間の核となる知識の一部として、オブジェクトの表現は、高レベルの概念と象徴 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10 | Learning 3D object-centric representation through prediction はコメントを受け付けていません

TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning

要約 テレビクリップのような複雑なマルチモーダルコンテンツに対して質問応答を行う … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning はコメントを受け付けていません

TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning

要約 テレビ クリップなどの複雑でマルチモーダルなコンテンツに対して質問応答を実 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning はコメントを受け付けていません

RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation

要約 オープンワールドのロボット操作のための高レベルのタスク計画とコード生成の急 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO, I.2.10 | RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation はコメントを受け付けていません

Beyond still images: Temporal features and input variance resilience

要約 従来、視覚モデルは主に静止画像から抽出された空間特徴に依存しており、自然視 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Beyond still images: Temporal features and input variance resilience はコメントを受け付けていません

UAV-assisted Visual SLAM Generating Reconstructed 3D Scene Graphs in GPS-denied Environments

要約 航空ロボットは、環境に関するロボットの状況認識が基本的な要求となるさまざま … 続きを読む

カテゴリー: cs.RO, I.2.10 | UAV-assisted Visual SLAM Generating Reconstructed 3D Scene Graphs in GPS-denied Environments はコメントを受け付けていません

Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos

要約 ビデオ アクション セグメンテーションは、多くの分野で広く適用されています … 続きを読む

カテゴリー: 68T01, 68T30, 68T45, cs.CV, cs.MM, I.2.10 | Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos はコメントを受け付けていません

CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs

要約 コーナーケースのシナリオは、自動運転車 (AV) の安全性をテストおよび検 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs はコメントを受け付けていません

Motion Perceiver: Real-Time Occupancy Forecasting for Embedded Systems

要約 本研究では、ソフトIOUのWaymo Open Motion Datase … 続きを読む

カテゴリー: cs.RO, I.2.10 | Motion Perceiver: Real-Time Occupancy Forecasting for Embedded Systems はコメントを受け付けていません

ALERT-Transformer: Bridging Asynchronous and Synchronous Machine Learning for Real-Time Event-based Spatio-Temporal Data

要約 我々は、イベントベースのセンサーによって生成された連続的な超スパース時空間 … 続きを読む

カテゴリー: 68T05, cs.CV, cs.LG, cs.NE, I.2.10 | ALERT-Transformer: Bridging Asynchronous and Synchronous Machine Learning for Real-Time Event-based Spatio-Temporal Data はコメントを受け付けていません