月別アーカイブ: 2024年9月

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

要約 拡散モデルの登場により、文字だけから多様で高品質な画像を生成できるようにな … 続きを読む

カテゴリー: cs.CV | Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects はコメントを受け付けていません

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

要約 以前のオーディオ駆動型トーキングヘッド生成 (THG) 方法は、駆動オーデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation はコメントを受け付けていません

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

要約 ディープフェイクの顔の蔓延は、私たちの日常生活に多大な悪影響を与える可能性 … 続きを読む

カテゴリー: cs.CV | Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection はコメントを受け付けていません

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

要約 事前トレーニングされたモデルを新しいタスクに適応させると、データセットごと … 続きを読む

カテゴリー: cs.CV, cs.LG | When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective はコメントを受け付けていません

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

要約 このペーパーでは、効率的な圧縮のための分散マッチング (DiME) と知識 … 続きを読む

カテゴリー: cs.CV, eess.IV | Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation はコメントを受け付けていません

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

要約 この論文では、learn2reg 2024 Challenge のタスク … 続きを読む

カテゴリー: cs.CV | Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024 はコメントを受け付けていません

Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening

要約 パンシャープンとハイパーシャープンの目的は、それぞれ高解像度のパンクロマテ … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening はコメントを受け付けていません

Improved Single Camera BEV Perception Using Multi-Camera Training

要約 Bird’s Eye View (BEV) 地図予測は、軌道予 … 続きを読む

カテゴリー: cs.CV | Improved Single Camera BEV Perception Using Multi-Camera Training はコメントを受け付けていません

Rethinking HTG Evaluation: Bridging Generation and Recognition

要約 自然画像タスクの生成モデルの評価は広範囲に研究されています。 完全に適切で … 続きを読む

カテゴリー: cs.CV | Rethinking HTG Evaluation: Bridging Generation and Recognition はコメントを受け付けていません

CLDA: Collaborative Learning for Enhanced Unsupervised Domain Adaptation

要約 教師なしドメイン適応 (UDA) は、ラベル付きソース ドメインでトレーニ … 続きを読む

カテゴリー: cs.CV | CLDA: Collaborative Learning for Enhanced Unsupervised Domain Adaptation はコメントを受け付けていません