「cs.CV」カテゴリーアーカイブ

Image Synthesis under Limited Data: A Survey and Taxonomy

投稿日: 2024年12月19日作成者: jarxiv

要約特定のデータ分布を再現して新しいサンプルを生成することを目的とした深層生成 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation

投稿日: 2024年12月19日作成者: jarxiv

要約 Text-to-Image (T2I) 拡散モデルは、画像生成において目覚 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process

投稿日: 2024年12月19日作成者: jarxiv

要約教師から生徒への知識伝達プロセスの不透明な性質により、知識蒸留 (KD) … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition

投稿日: 2024年12月19日作成者: jarxiv

要約この研究では、説明によるゼロショット「実際の」分類を定義して取り組みます。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence

投稿日: 2024年12月19日作成者: jarxiv

要約大規模ビジョン言語モデル (LVLM) は、大規模言語モデル (LLM) … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

投稿日: 2024年12月19日作成者: jarxiv

要約食道がんは、世界中で最も一般的ながんの種類の 1 つです。従来、開腹食道 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CNNtention: Can CNNs do better with Attention?

投稿日: 2024年12月19日作成者: jarxiv

要約畳み込みニューラルネットワーク (CNN) は長い間画像分類タスクの標準 … 続きを読む →

カテゴリー: (Primary), 68T07, cs.CV, cs.LG | コメントを受け付けていません

Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge

投稿日: 2024年12月19日作成者: jarxiv

要約 Contrastive Language-Image Pretrainin … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians

投稿日: 2024年12月19日作成者: jarxiv

要約任意の視点からフォトリアリスティックなヘッドアバターをレンダリングするこ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Real-Time Position-Aware View Synthesis from Single-View Input

投稿日: 2024年12月19日作成者: jarxiv

要約ビュー合成の最近の進歩により、テレプレゼンスやエンターテイメントを含む、さ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Image Synthesis under Limited Data: A Survey and Taxonomy

AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation

On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process

Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition

Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

CNNtention: Can CNNs do better with Attention?

Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge

GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians

Real-Time Position-Aware View Synthesis from Single-View Input

最近の投稿

最近のコメント

アーカイブ

カテゴリー