「cs.CV」カテゴリーアーカイブ

DEIM: DETR with Improved Matching for Fast Convergence

投稿日: 2024年12月6日作成者: jarxiv

要約 DEIM は、Transformer ベースのアーキテクチャ (DETR) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers

投稿日: 2024年12月6日作成者: jarxiv

要約画像からグラフへの直接変換は、単一モデルでオブジェクトの検出と関係予測を解 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation

投稿日: 2024年12月6日作成者: jarxiv

要約組織病理学的画像処理の分野におけるドメインシフトは、染色およびデジタル化プ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model

投稿日: 2024年12月6日作成者: jarxiv

要約非常に現実的な画像を作成する生成モデルの急速な進歩は、誤った情報の流布に大 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts

投稿日: 2024年12月6日作成者: jarxiv

要約合成画像の品質を評価することは、テキストから画像への (T2I) 生成の開 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

HydraViT: Stacking Heads for a Scalable ViT

投稿日: 2024年12月6日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) のアーキテクチャ、特にマルチヘッ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Enhancing Novel Object Detection via Cooperative Foundational Models

投稿日: 2024年12月6日作成者: jarxiv

要約この研究では、推論中に既知のオブジェクトカテゴリと新しいオブジェクトカ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse

投稿日: 2024年12月6日作成者: jarxiv

要約モーション生成は大幅に進歩しましたが、その実用化には依然としてデータセット … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery

投稿日: 2024年12月6日作成者: jarxiv

要約この論文では、既知のカテゴリのラベル付きデータの知識を使用して、既知と未知 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise

投稿日: 2024年12月6日作成者: jarxiv

要約顕微鏡画像の正確な分析は、ノイズの存在によって妨げられます。このノイズは … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

DEIM: DETR with Improved Matching for Fast Convergence

Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers

Enhancing Whole Slide Image Classification through Supervised Contrastive Domain Adaptation

SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model

T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts

HydraViT: Stacking Heads for a Scalable ViT

Enhancing Novel Object Detection via Cooperative Foundational Models

RMD: A Simple Baseline for More General Human Motion Generation via Training-free Retrieval-Augmented Motion Diffuse

Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery

Unsupervised Denoising for Signal-Dependent and Row-Correlated Imaging Noise

最近の投稿

最近のコメント

アーカイブ

カテゴリー