cs.CV」カテゴリーアーカイブ

How Far Are We from Intelligent Visual Deductive Reasoning?

要約 視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | How Far Are We from Intelligent Visual Deductive Reasoning? はコメントを受け付けていません

Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving

要約 セマンティック セグメンテーションは、自動運転における重要な認識タスクです … 続きを読む

カテゴリー: cs.AI, cs.CV | Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving はコメントを受け付けていません

SVFAP: Self-supervised Video Facial Affect Perceiver

要約 ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | SVFAP: Self-supervised Video Facial Affect Perceiver はコメントを受け付けていません

Continual Learning in Medical Imaging: A Survey and Practical Analysis

要約 ディープラーニングは医療画像の再構築において大きな成功を収めていますが、広 … 続きを読む

カテゴリー: cs.CV | Continual Learning in Medical Imaging: A Survey and Practical Analysis はコメントを受け付けていません

Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning

要約 ジュニパーのような長命の大低木の分布とサイズを監視することは、地球規模の変 … 続きを読む

カテゴリー: cs.AI, cs.CV | Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning はコメントを受け付けていません

Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling

要約 この研究では、ビジュアル言語モデル (VLM) のトランスフォーマーを、シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling はコメントを受け付けていません

SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models

要約 テキストから画像への拡散モデル (SD) は、膨大な計算リソースを必要とす … 続きを読む

カテゴリー: cs.CV, cs.LG | SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models はコメントを受け付けていません

Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis

要約 あらゆる環境、あらゆる物体でシームレスに動作し、さまざまなスキルを活用して … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis はコメントを受け付けていません

SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection

要約 自動車シミュレーションは、コンピューター ビジョン アプリケーションにおけ … 続きを読む

カテゴリー: cs.CV | SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection はコメントを受け付けていません

Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles

要約 異なるセンサー モダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む

カテゴリー: cs.CV, cs.RO | Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles はコメントを受け付けていません