月別アーカイブ: 2022年7月

BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis

投稿日: 2022年7月25日作成者: jarxiv

要約オーディオ調整されたダンスモーション合成の生成モデルは、音楽機能をダンスの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal

投稿日: 2022年7月25日作成者: jarxiv

要約人間の行動を理解するには、単一のRGB画像から3Dの相互作用する手のポーズ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Hierarchical Average Precision Training for Pertinent Image Retrieval

投稿日: 2022年7月25日作成者: jarxiv

要約画像検索は通常、平均適合率（AP）または再現率@kで評価されます。ただし … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

AiATrack: Attention in Attention for Transformer Visual Tracking

投稿日: 2022年7月25日作成者: jarxiv

要約 Transformerトラッカーは最近目覚ましい進歩を遂げており、注意メカ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos

投稿日: 2022年7月25日作成者: jarxiv

要約ピクセル単位のフローラベルの手動注釈は法外に費用がかかり、手間がかかるため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining

投稿日: 2022年7月25日作成者: jarxiv

要約人間は通常、顔の表情によって自発的または非自発的に感情を伝えます。顔の画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images

投稿日: 2022年7月25日作成者: jarxiv

要約この論文は、より高い精度でタスクを数える高密度の小さな物体（酵母細胞）のた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks

投稿日: 2022年7月25日作成者: jarxiv

要約コンピュータビジョンで重要な役割を果たす人間の動きの予測は、通常、入力とし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos

投稿日: 2022年7月25日作成者: jarxiv

要約ディープラーニングの登場により、画像データからの単眼3D顔再構成に関する最 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-temporal speckle reduction with self-supervised deep neural networks

投稿日: 2022年7月25日作成者: jarxiv

要約スペックルフィルタリングは、通常、合成開口レーダー（SAR）画像の分析の前 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

月別アーカイブ: 2022年7月

BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis

3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal

Hierarchical Average Precision Training for Pertinent Image Retrieval

AiATrack: Attention in Attention for Transformer Visual Tracking

RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos

Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining

An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images

Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks

Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos

Multi-temporal speckle reduction with self-supervised deep neural networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー