-
最近の投稿
- AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45004) cs.HC (3030) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「I.2.10」カテゴリーアーカイブ
CM-PIE: Cross-modal perception for interactive-enhanced audio-visual video parsing
要約 オーディオビジュアルビデオの解析は、弱いラベルを使用してセグメントレベルで … 続きを読む
Edge Video Analytics: A Survey on Applications, Systems and Enabling Techniques
要約 ビデオは、デジタル情報の世界的な爆発の主要な原動力として、人間社会に多大な … 続きを読む
Photonic Accelerators for Image Segmentation in Autonomous Driving and Defect Detection
要約 フォトニックコンピューティングは、従来のデジタルハードウェアよりも高速でエ … 続きを読む
Perception-and-Energy-aware Motion Planning for UAV using Learning-based Model under Heteroscedastic Uncertainty
要約 全地球測位衛星システム (GNSS) が拒否される環境/状況では、無人航空 … 続きを読む
Overview of Class Activation Maps for Visualization Explainability
要約 深層学習方法論の最近の研究により、人間のパフォーマンスに達する、あるいは人 … 続きを読む
CNN-based local features for navigation near an asteroid
要約 この記事では、小惑星探査ミッションおよび軌道上サービスにおける視覚ベースの … 続きを読む
Vision-based Situational Graphs Generating Optimizable 3D Scene Representations
要約 3D シーン グラフは、多様な意味エンティティとそれらの間のトポロジ関係を … 続きを読む
CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs
要約 コーナーケースのシナリオは、自動運転車 (AV) の安全性をテストおよび検 … 続きを読む
Padding-free Convolution based on Preservation of Differential Characteristics of Kernels
要約 畳み込みは、画像処理と機械学習の基本的な操作です。 パディングは主に画像サ … 続きを読む
FlowIBR: Leveraging Pre-Training for Efficient Neural Image-Based Rendering of Dynamic Scenes
要約 動的シーンの単眼新視点合成のための新しいアプローチを紹介します。 既存の技 … 続きを読む