cs.CV」カテゴリーアーカイブ

RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models

要約 RGB-Th-Benchは、RGBサーマル画像ペアを理解するための視覚言語 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models はコメントを受け付けていません

BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction

要約 書誌メタデータの手動デジタル化は、特に文書間で非常に可変的なフォーマットを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction はコメントを受け付けていません

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

要約 ステレオ深度の推定の進行にもかかわらず、主に適切なデータがないため、全方向 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation はコメントを受け付けていません

Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations

要約 エゴセントリック(ファーストパーソン、エゴ)およびエクソセントリック(サー … 続きを読む

カテゴリー: cs.AI, cs.CV | Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations はコメントを受け付けていません

On What Depends the Robustness of Multi-source Models to Missing Data in Earth Observation?

要約 近年、堅牢なマルチソースモデルの開発が地球観察(EO)分野で登場しています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | On What Depends the Robustness of Multi-source Models to Missing Data in Earth Observation? はコメントを受け付けていません

CamSAM2: Segment Anything Accurately in Camouflaged Videos

要約 ビデオカモフラージュオブジェクトセグメンテーション(VCO)は、環境にシー … 続きを読む

カテゴリー: cs.AI, cs.CV | CamSAM2: Segment Anything Accurately in Camouflaged Videos はコメントを受け付けていません

When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning

要約 大きなリモートセンシング画像(RSI)の効率的な視覚言語の理解は意味があり … 続きを読む

カテゴリー: cs.AI, cs.CV | When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning はコメントを受け付けていません

A Survey on Event-driven 3D Reconstruction: Development under Different Categories

要約 イベントカメラは、時間分解能が高い、遅延が低く、ダイナミックレンジが高いた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | A Survey on Event-driven 3D Reconstruction: Development under Different Categories はコメントを受け付けていません

Localized Concept Erasure for Text-to-Image Diffusion Models Using Training-Free Gated Low-Rank Adaptation

要約 微調整ベースの概念の消去は、残りの概念を維持しながらターゲットの概念を削除 … 続きを読む

カテゴリー: cs.AI, cs.CV | Localized Concept Erasure for Text-to-Image Diffusion Models Using Training-Free Gated Low-Rank Adaptation はコメントを受け付けていません

FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models

要約 この作業では、低レベルのビジョンタスクに対して、単一画像の超解像度(SIS … 続きを読む

カテゴリー: cs.CV, eess.IV | FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models はコメントを受け付けていません