-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
「cs.CV」カテゴリーアーカイブ
How Far Are We from Intelligent Visual Deductive Reasoning?
要約 視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む
Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving
要約 セマンティック セグメンテーションは、自動運転における重要な認識タスクです … 続きを読む
SVFAP: Self-supervised Video Facial Affect Perceiver
要約 ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む
Continual Learning in Medical Imaging: A Survey and Practical Analysis
要約 ディープラーニングは医療画像の再構築において大きな成功を収めていますが、広 … 続きを読む
Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning
要約 ジュニパーのような長命の大低木の分布とサイズを監視することは、地球規模の変 … 続きを読む
Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling
要約 この研究では、ビジュアル言語モデル (VLM) のトランスフォーマーを、シ … 続きを読む
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models
要約 テキストから画像への拡散モデル (SD) は、膨大な計算リソースを必要とす … 続きを読む
Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis
要約 あらゆる環境、あらゆる物体でシームレスに動作し、さまざまなスキルを活用して … 続きを読む
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection
要約 自動車シミュレーションは、コンピューター ビジョン アプリケーションにおけ … 続きを読む
Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles
要約 異なるセンサー モダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む