cs.CV」カテゴリーアーカイブ

LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、2D 視覚理 … 続きを読む

カテゴリー: cs.CV | コメントする

EgoLM: Multi-Modal Language Model of Egocentric Motions

要約 ウェアラブルデバイスの普及に伴い、コンテキストAIの開発には自己中心的な動 … 続きを読む

カテゴリー: cs.CV | コメントする

FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner

要約 ビジュアル生成における拡散モデルの成功を基礎として、フローベースのモデルは … 続きを読む

カテゴリー: cs.CV | コメントする

LingoQA: Visual Question Answering for Autonomous Driving

要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントする

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントする

Vision-Language Model Fine-Tuning via Simple Parameter-Efficient Modification

要約 ビジョン言語モデル (VLM) の微調整における最近の進歩により、プロンプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントする

Inline Photometrically Calibrated Hybrid Visual SLAM

要約 このペーパーでは、ハイブリッド直接間接ビジュアル SLAM (H-SLAM … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | コメントする

The Role of Language Models in Modern Healthcare: A Comprehensive Review

要約 ヘルスケアにおける大規模言語モデル (LLM) の適用は、複雑な医療データ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Event-Free Moving Object Segmentation from Moving Ego Vehicle

要約 動的シーンにおける移動物体セグメンテーション (MOS) は、自動運転、特 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする