「cs.CV」カテゴリーアーカイブ

RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models

投稿日: 2025年3月26日作成者: jarxiv

要約 RGB-Th-Benchは、RGBサーマル画像ペアを理解するための視覚言語 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction

投稿日: 2025年3月26日作成者: jarxiv

要約書誌メタデータの手動デジタル化は、特に文書間で非常に可変的なフォーマットを … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

投稿日: 2025年3月26日作成者: jarxiv

要約ステレオ深度の推定の進行にもかかわらず、主に適切なデータがないため、全方向 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations

投稿日: 2025年3月26日作成者: jarxiv

要約エゴセントリック（ファーストパーソン、エゴ）およびエクソセントリック（サー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

On What Depends the Robustness of Multi-source Models to Missing Data in Earth Observation?

投稿日: 2025年3月26日作成者: jarxiv

要約近年、堅牢なマルチソースモデルの開発が地球観察（EO）分野で登場しています … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

CamSAM2: Segment Anything Accurately in Camouflaged Videos

投稿日: 2025年3月26日作成者: jarxiv

要約ビデオカモフラージュオブジェクトセグメンテーション（VCO）は、環境にシー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning

投稿日: 2025年3月26日作成者: jarxiv

要約大きなリモートセンシング画像（RSI）の効率的な視覚言語の理解は意味があり … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Survey on Event-driven 3D Reconstruction: Development under Different Categories

投稿日: 2025年3月26日作成者: jarxiv

要約イベントカメラは、時間分解能が高い、遅延が低く、ダイナミックレンジが高いた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Localized Concept Erasure for Text-to-Image Diffusion Models Using Training-Free Gated Low-Rank Adaptation

投稿日: 2025年3月26日作成者: jarxiv

要約微調整ベースの概念の消去は、残りの概念を維持しながらターゲットの概念を削除 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models

投稿日: 2025年3月26日作成者: jarxiv

要約この作業では、低レベルのビジョンタスクに対して、単一画像の超解像度（SIS … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models

BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations

On What Depends the Robustness of Multi-source Models to Missing Data in Earth Observation?

CamSAM2: Segment Anything Accurately in Camouflaged Videos

When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning

A Survey on Event-driven 3D Reconstruction: Development under Different Categories

Localized Concept Erasure for Text-to-Image Diffusion Models Using Training-Free Gated Low-Rank Adaptation

FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー