cs.CV」カテゴリーアーカイブ

Image Synthesis under Limited Data: A Survey and Taxonomy

要約 特定のデータ分布を再現して新しいサンプルを生成することを目的とした深層生成 … 続きを読む

カテゴリー: cs.AI, cs.CV | Image Synthesis under Limited Data: A Survey and Taxonomy はコメントを受け付けていません

AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation

要約 Text-to-Image (T2I) 拡散モデルは、画像生成において目覚 … 続きを読む

カテゴリー: cs.CV | AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation はコメントを受け付けていません

On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process

要約 教師から生徒への知識伝達プロセスの不透明な性質により、知識蒸留 (KD) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process はコメントを受け付けていません

Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition

要約 この研究では、説明によるゼロショット「実際の」分類を定義して取り組みます。 … 続きを読む

カテゴリー: cs.CV | Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition はコメントを受け付けていません

Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence

要約 大規模ビジョン言語モデル (LVLM) は、大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.CV | Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence はコメントを受け付けていません

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

要約 食道がんは、世界中で最も一般的ながんの種類の 1 つです。 従来、開腹食道 … 続きを読む

カテゴリー: cs.AI, cs.CV | Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy はコメントを受け付けていません

CNNtention: Can CNNs do better with Attention?

要約 畳み込みニューラル ネットワーク (CNN) は長い間画像分類タスクの標準 … 続きを読む

カテゴリー: (Primary), 68T07, cs.CV, cs.LG | CNNtention: Can CNNs do better with Attention? はコメントを受け付けていません

Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge

要約 Contrastive Language-Image Pretrainin … 続きを読む

カテゴリー: cs.CV | Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge はコメントを受け付けていません

GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians

要約 任意の視点からフォトリアリスティックなヘッド アバターをレンダリングするこ … 続きを読む

カテゴリー: cs.CV | GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians はコメントを受け付けていません

Real-Time Position-Aware View Synthesis from Single-View Input

要約 ビュー合成の最近の進歩により、テレプレゼンスやエンターテイメントを含む、さ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | Real-Time Position-Aware View Synthesis from Single-View Input はコメントを受け付けていません