「cs.CV」カテゴリーアーカイブ

MMA-MRNNet: Harnessing Multiple Models of Affect and Dynamic Masked RNN for Precise Facial Expression Intensity Estimation

投稿日: 2024年9月5日作成者: jarxiv

要約この論文では、ビデオデータからの動的マルチ出力顔表情強度推定 (FEIE … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos

投稿日: 2024年9月5日作成者: jarxiv

要約自己中心的なビデオを通じて人間の意図と行動を理解することは、身体化された人 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Learning-Based Error Detection System for Advanced Vehicle Instrument Cluster Rendering

投稿日: 2024年9月5日作成者: jarxiv

要約自動車業界は現在、新モデルが市場に投入されるたびにデジタルディスプレイの … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO, eess.IV | コメントを受け付けていません

Creating a Microstructure Latent Space with Rich Material Information for Multiphase Alloy Design

投稿日: 2024年9月5日作成者: jarxiv

要約複雑な微細構造は、多相合金の組成/加工-構造-特性 (CPSP) の関係の … 続きを読む →

カテゴリー: cond-mat.mtrl-sci, cs.CV | コメントを受け付けていません

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

投稿日: 2024年9月5日作成者: jarxiv

要約拡散モデルの登場により、文字だけから多様で高品質な画像を生成できるようにな … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

投稿日: 2024年9月5日作成者: jarxiv

要約以前のオーディオ駆動型トーキングヘッド生成 (THG) 方法は、駆動オーデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

投稿日: 2024年9月5日作成者: jarxiv

要約ディープフェイクの顔の蔓延は、私たちの日常生活に多大な悪影響を与える可能性 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

投稿日: 2024年9月5日作成者: jarxiv

要約事前トレーニングされたモデルを新しいタスクに適応させると、データセットごと … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

投稿日: 2024年9月5日作成者: jarxiv

要約このペーパーでは、効率的な圧縮のための分散マッチング (DiME) と知識 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

投稿日: 2024年9月5日作成者: jarxiv

要約この論文では、learn2reg 2024 Challenge のタスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

MMA-MRNNet: Harnessing Multiple Models of Affect and Dynamic Masked RNN for Precise Facial Expression Intensity Estimation

MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos

Learning-Based Error Detection System for Advanced Vehicle Instrument Cluster Rendering

Creating a Microstructure Latent Space with Rich Material Information for Multiphase Alloy Design

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

最近の投稿

最近のコメント

アーカイブ

カテゴリー