cs.CV」カテゴリーアーカイブ

GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving

要約 高品質のマルチモーダル軌道を生成するためのエンドツーエンドの自律運転方法で … 続きを読む

カテゴリー: cs.CV | GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving はコメントを受け付けていません

Spatial regularisation for improved accuracy and interpretability in keypoint-based registration

要約 監視されていない登録戦略は、固定ボリュームと移動されたボリューム間の類似性 … 続きを読む

カテゴリー: cs.CV | Spatial regularisation for improved accuracy and interpretability in keypoint-based registration はコメントを受け付けていません

Question-Aware Gaussian Experts for Audio-Visual Question Answering

要約 視聴覚質問応答(AVQA)には、質問に基づいたマルチモーダル推論だけでなく … 続きを読む

カテゴリー: cs.CV | Question-Aware Gaussian Experts for Audio-Visual Question Answering はコメントを受け付けていません

Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving

要約 Dur360Bevは、高解像度の128チャンネル3D LIDARとRTK- … 続きを読む

カテゴリー: cs.CV, cs.RO | Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving はコメントを受け付けていません

GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping

要約 幾何学的代数表現を活用して、SE(3)変換への等量化を強制する器用な把握生 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping はコメントを受け付けていません

DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems

要約 協調的な同時ローカリゼーションとマッピング(C-SLAM)により、複数のエ … 続きを読む

カテゴリー: cs.CV, cs.MA, cs.RO | DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems はコメントを受け付けていません

Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process

要約 現実世界のタスク、特に屋外の非構造化環境での地上モバイルロボットを実際に適 … 続きを読む

カテゴリー: cs.CV, cs.RO | Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process はコメントを受け付けていません

Shaken, Not Stirred: A Novel Dataset for Visual Understanding of Glasses in Human-Robot Bartending Tasks

要約 オブジェクト検出のためのデータセットは、透明で反射的な特性のため、十分な種 … 続きを読む

カテゴリー: 68T40, cs.CV, cs.RO, I.2.9 | Shaken, Not Stirred: A Novel Dataset for Visual Understanding of Glasses in Human-Robot Bartending Tasks はコメントを受け付けていません

A Backbone for Long-Horizon Robot Task Understanding

要約 特に長老のタスクでは、エンドツーエンドのロボット学習は、予測不可能な結果と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.RO | A Backbone for Long-Horizon Robot Task Understanding はコメントを受け付けていません

EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images

要約 構造化されていない環境でのシーンの理解のために、自律システムによる情報に基 … 続きを読む

カテゴリー: cs.CV, cs.RO | EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images はコメントを受け付けていません