cs.CV」カテゴリーアーカイブ

FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning

要約 この研究では、豊富なラベルのない本当の顔を使って、一般化パフォーマンスに関 … 続きを読む

カテゴリー: cs.AI, cs.CV | FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning はコメントを受け付けていません

EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation

要約 オープンボキャブラリーのパノプティックセグメンテーションは、境界のないボキ … 続きを読む

カテゴリー: cs.CV | EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation はコメントを受け付けていません

A LoRA is Worth a Thousand Pictures

要約 拡散モデルとパラメータ効率の良い微調整 (PEFT) の最近の進歩により、 … 続きを読む

カテゴリー: cs.CV | A LoRA is Worth a Thousand Pictures はコメントを受け付けていません

Exploring Semantic Consistency and Style Diversity for Domain Generalized Semantic Segmentation

要約 ドメイン一般化セマンティック セグメンテーション (DGSS) は、ソース … 続きを読む

カテゴリー: cs.CV | Exploring Semantic Consistency and Style Diversity for Domain Generalized Semantic Segmentation はコメントを受け付けていません

SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework

要約 分光光音響 (sPA) イメージングでは、複数の波長を使用して、発色団をそ … 続きを読む

カテゴリー: cs.CV | SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework はコメントを受け付けていません

CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding

要約 マルチモーダル大規模言語モデル (MLLM) の既存のビデオ理解ベンチマー … 続きを読む

カテゴリー: cs.CV | CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding はコメントを受け付けていません

CPath-Omni: A Unified Multimodal Foundation Model for Patch and Whole Slide Image Analysis in Computational Pathology

要約 大規模マルチモーダル モデル (LMM) の出現により、病理学に大きな進歩 … 続きを読む

カテゴリー: cs.CV | CPath-Omni: A Unified Multimodal Foundation Model for Patch and Whole Slide Image Analysis in Computational Pathology はコメントを受け付けていません

UniLoc: Towards Universal Place Recognition Using Any Single Modality

要約 現在までのところ、ほとんどの場所認識方法は単一モダリティの検索に焦点を当て … 続きを読む

カテゴリー: cs.CV | UniLoc: Towards Universal Place Recognition Using Any Single Modality はコメントを受け付けていません

IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations

要約 画像から幾何学的情報や材質情報を取得することは、コンピューター ビジョンと … 続きを読む

カテゴリー: cs.CV | IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations はコメントを受け付けていません

Probing the Mid-level Vision Capabilities of Self-Supervised Learning

要約 一般的なオブジェクトの位置特定や 3D 幾何学的な理解などの中レベルの視覚 … 続きを読む

カテゴリー: cs.CV | Probing the Mid-level Vision Capabilities of Self-Supervised Learning はコメントを受け付けていません