cs.CV」カテゴリーアーカイブ

How Far Are We from Intelligent Visual Deductive Reasoning?

要約 視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving

要約 セマンティック セグメンテーションは、自動運転における重要な認識タスクです … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

SVFAP: Self-supervised Video Facial Affect Perceiver

要約 ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | コメントする

Continual Learning in Medical Imaging: A Survey and Practical Analysis

要約 ディープラーニングは医療画像の再構築において大きな成功を収めていますが、広 … 続きを読む

カテゴリー: cs.CV | コメントする

Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning

要約 ジュニパーのような長命の大低木の分布とサイズを監視することは、地球規模の変 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling

要約 この研究では、ビジュアル言語モデル (VLM) のトランスフォーマーを、シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models

要約 テキストから画像への拡散モデル (SD) は、膨大な計算リソースを必要とす … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis

要約 あらゆる環境、あらゆる物体でシームレスに動作し、さまざまなスキルを活用して … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection

要約 自動車シミュレーションは、コンピューター ビジョン アプリケーションにおけ … 続きを読む

カテゴリー: cs.CV | コメントする

Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles

要約 異なるセンサー モダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする