cs.CV」カテゴリーアーカイブ

DEIM: DETR with Improved Matching for Fast Convergence

要約 DEIM は、Transformer ベースのアーキテクチャ (DETR) … 続きを読む

カテゴリー: cs.AI, cs.CV | DEIM: DETR with Improved Matching for Fast Convergence はコメントを受け付けていません

Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers

要約 画像からグラフへの直接変換は、単一モデルでオブジェクトの検出と関係予測を解 … 続きを読む

カテゴリー: cs.AI, cs.CV | Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers はコメントを受け付けていません

Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation

要約 組織病理学的画像処理の分野におけるドメインシフトは、染色およびデジタル化プ … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation はコメントを受け付けていません

SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model

要約 非常に現実的な画像を作成する生成モデルの急速な進歩は、誤った情報の流布に大 … 続きを読む

カテゴリー: cs.AI, cs.CV | SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model はコメントを受け付けていません

T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts

要約 合成画像の品質を評価することは、テキストから画像への (T2I) 生成の開 … 続きを読む

カテゴリー: cs.AI, cs.CV | T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts はコメントを受け付けていません

HydraViT: Stacking Heads for a Scalable ViT

要約 ビジョン トランスフォーマー (ViT) のアーキテクチャ、特にマルチヘッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HydraViT: Stacking Heads for a Scalable ViT はコメントを受け付けていません

Enhancing Novel Object Detection via Cooperative Foundational Models

要約 この研究では、推論中に既知のオブジェクト カテゴリと新しいオブジェクト カ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Enhancing Novel Object Detection via Cooperative Foundational Models はコメントを受け付けていません

RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse

要約 モーション生成は大幅に進歩しましたが、その実用化には依然としてデータセット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse はコメントを受け付けていません

Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery

要約 この論文では、既知のカテゴリのラベル付きデータの知識を使用して、既知と未知 … 続きを読む

カテゴリー: cs.CV | Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery はコメントを受け付けていません

Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise

要約 顕微鏡画像の正確な分析は、ノイズの存在によって妨げられます。 このノイズは … 続きを読む

カテゴリー: cs.CV, eess.IV | Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise はコメントを受け付けていません