-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.CV」カテゴリーアーカイブ
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness
要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、2D 視覚理 … 続きを読む
EgoLM: Multi-Modal Language Model of Egocentric Motions
要約 ウェアラブルデバイスの普及に伴い、コンテキストAIの開発には自己中心的な動 … 続きを読む
FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner
要約 ビジュアル生成における拡散モデルの成功を基礎として、フローベースのモデルは … 続きを読む
LingoQA: Visual Question Answering for Autonomous Driving
要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Vision-Language Model Fine-Tuning via Simple Parameter-Efficient Modification
要約 ビジョン言語モデル (VLM) の微調整における最近の進歩により、プロンプ … 続きを読む
Inline Photometrically Calibrated Hybrid Visual SLAM
要約 このペーパーでは、ハイブリッド直接間接ビジュアル SLAM (H-SLAM … 続きを読む
The Role of Language Models in Modern Healthcare: A Comprehensive Review
要約 ヘルスケアにおける大規模言語モデル (LLM) の適用は、複雑な医療データ … 続きを読む
Event-Free Moving Object Segmentation from Moving Ego Vehicle
要約 動的シーンにおける移動物体セグメンテーション (MOS) は、自動運転、特 … 続きを読む