「cs.CV」カテゴリーアーカイブ

How Far Are We from Intelligent Visual Deductive Reasoning?

投稿日: 2024年10月2日作成者: jarxiv

要約視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving

投稿日: 2024年10月2日作成者: jarxiv

要約セマンティックセグメンテーションは、自動運転における重要な認識タスクです … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SVFAP: Self-supervised Video Facial Affect Perceiver

投稿日: 2024年10月2日作成者: jarxiv

要約ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Continual Learning in Medical Imaging: A Survey and Practical Analysis

投稿日: 2024年10月2日作成者: jarxiv

要約ディープラーニングは医療画像の再構築において大きな成功を収めていますが、広 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning

投稿日: 2024年10月2日作成者: jarxiv

要約ジュニパーのような長命の大低木の分布とサイズを監視することは、地球規模の変 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling

投稿日: 2024年10月2日作成者: jarxiv

要約この研究では、ビジュアル言語モデル (VLM) のトランスフォーマーを、シ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models

投稿日: 2024年10月2日作成者: jarxiv

要約テキストから画像への拡散モデル (SD) は、膨大な計算リソースを必要とす … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis

投稿日: 2024年10月2日作成者: jarxiv

要約あらゆる環境、あらゆる物体でシームレスに動作し、さまざまなスキルを活用して … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection

投稿日: 2024年10月2日作成者: jarxiv

要約自動車シミュレーションは、コンピュータービジョンアプリケーションにおけ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles

投稿日: 2024年10月2日作成者: jarxiv

要約異なるセンサーモダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

How Far Are We from Intelligent Visual Deductive Reasoning?

Segment-Anything Models Achieve Zero-shot Robustness in Autonomous Driving

SVFAP: Self-supervised Video Facial Affect Perceiver

Continual Learning in Medical Imaging: A Survey and Practical Analysis

Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning

Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling

SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models

Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis

SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection

Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles

最近の投稿

最近のコメント

アーカイブ

カテゴリー