cs.CV」カテゴリーアーカイブ

MMA-MRNNet: Harnessing Multiple Models of Affect and Dynamic Masked RNN for Precise Facial Expression Intensity Estimation

要約 この論文では、ビデオ データからの動的マルチ出力顔表情強度推定 (FEIE … 続きを読む

カテゴリー: cs.CV, cs.LG | MMA-MRNNet: Harnessing Multiple Models of Affect and Dynamic Masked RNN for Precise Facial Expression Intensity Estimation はコメントを受け付けていません

MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos

要約 自己中心的なビデオを通じて人間の意図と行動を理解することは、身体化された人 … 続きを読む

カテゴリー: cs.CV | MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos はコメントを受け付けていません

Learning-Based Error Detection System for Advanced Vehicle Instrument Cluster Rendering

要約 自動車業界は現在、新モデルが市場に投入されるたびにデジタル ディスプレイの … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO, eess.IV | Learning-Based Error Detection System for Advanced Vehicle Instrument Cluster Rendering はコメントを受け付けていません

Creating a Microstructure Latent Space with Rich Material Information for Multiphase Alloy Design

要約 複雑な微細構造は、多相合金の組成/加工-構造-特性 (CPSP) の関係の … 続きを読む

カテゴリー: cond-mat.mtrl-sci, cs.CV | Creating a Microstructure Latent Space with Rich Material Information for Multiphase Alloy Design はコメントを受け付けていません

Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects

要約 拡散モデルの登場により、文字だけから多様で高品質な画像を生成できるようにな … 続きを読む

カテゴリー: cs.CV | Skip-and-Play: Depth-Driven Pose-Preserved Image Generation for Any Objects はコメントを受け付けていません

PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation

要約 以前のオーディオ駆動型トーキングヘッド生成 (THG) 方法は、駆動オーデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation はコメントを受け付けていません

Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection

要約 ディープフェイクの顔の蔓延は、私たちの日常生活に多大な悪影響を与える可能性 … 続きを読む

カテゴリー: cs.CV | Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection はコメントを受け付けていません

When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective

要約 事前トレーニングされたモデルを新しいタスクに適応させると、データセットごと … 続きを読む

カテゴリー: cs.CV, cs.LG | When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective はコメントを受け付けていません

Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation

要約 このペーパーでは、効率的な圧縮のための分散マッチング (DiME) と知識 … 続きを読む

カテゴリー: cs.CV, eess.IV | Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation はコメントを受け付けていません

Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024

要約 この論文では、learn2reg 2024 Challenge のタスク … 続きを読む

カテゴリー: cs.CV | Large Scale Unsupervised Brain MRI Image Registration Solution for Learn2Reg 2024 はコメントを受け付けていません