月別アーカイブ: 2024年9月

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

投稿日: 2024年9月5日作成者: jarxiv

要約拡散モデルの登場により、文字だけから多様で高品質な画像を生成できるようにな … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

投稿日: 2024年9月5日作成者: jarxiv

要約以前のオーディオ駆動型トーキングヘッド生成 (THG) 方法は、駆動オーデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

投稿日: 2024年9月5日作成者: jarxiv

要約ディープフェイクの顔の蔓延は、私たちの日常生活に多大な悪影響を与える可能性 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

投稿日: 2024年9月5日作成者: jarxiv

要約事前トレーニングされたモデルを新しいタスクに適応させると、データセットごと … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

投稿日: 2024年9月5日作成者: jarxiv

要約このペーパーでは、効率的な圧縮のための分散マッチング (DiME) と知識 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

投稿日: 2024年9月5日作成者: jarxiv

要約この論文では、learn2reg 2024 Challenge のタスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening

投稿日: 2024年9月5日作成者: jarxiv

要約パンシャープンとハイパーシャープンの目的は、それぞれ高解像度のパンクロマテ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Improved Single Camera BEV Perception Using Multi-Camera Training

投稿日: 2024年9月5日作成者: jarxiv

要約 Bird’s Eye View (BEV) 地図予測は、軌道予 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rethinking HTG Evaluation: Bridging Generation and Recognition

投稿日: 2024年9月5日作成者: jarxiv

要約自然画像タスクの生成モデルの評価は広範囲に研究されています。完全に適切で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CLDA: Collaborative Learning for Enhanced Unsupervised Domain Adaptation

投稿日: 2024年9月5日作成者: jarxiv

要約教師なしドメイン適応 (UDA) は、ラベル付きソースドメインでトレーニ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年9月

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening

Improved Single Camera BEV Perception Using Multi-Camera Training

Rethinking HTG Evaluation: Bridging Generation and Recognition

CLDA: Collaborative Learning for Enhanced Unsupervised Domain Adaptation

最近の投稿

最近のコメント

アーカイブ

カテゴリー