月別アーカイブ: 2022年7月

BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis

要約 オーディオ調整されたダンスモーション合成の生成モデルは、音楽機能をダンスの … 続きを読む

カテゴリー: cs.CV | BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis はコメントを受け付けていません

3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal

要約 人間の行動を理解するには、単一のRGB画像から3Dの相互作用する手のポーズ … 続きを読む

カテゴリー: cs.CV | 3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal はコメントを受け付けていません

Hierarchical Average Precision Training for Pertinent Image Retrieval

要約 画像検索は通常、平均適合率(AP)または再現率@kで評価されます。 ただし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Hierarchical Average Precision Training for Pertinent Image Retrieval はコメントを受け付けていません

AiATrack: Attention in Attention for Transformer Visual Tracking

要約 Transformerトラッカーは最近目覚ましい進歩を遂げており、注意メカ … 続きを読む

カテゴリー: cs.CV | AiATrack: Attention in Attention for Transformer Visual Tracking はコメントを受け付けていません

RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos

要約 ピクセル単位のフローラベルの手動注釈は法外に費用がかかり、手間がかかるため … 続きを読む

カテゴリー: cs.CV | RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos はコメントを受け付けていません

Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining

要約 人間は通常、顔の表情によって自発的または非自発的に感情を伝えます。 顔の画 … 続きを読む

カテゴリー: cs.CV | Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining はコメントを受け付けていません

An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images

要約 この論文は、より高い精度でタスクを数える高密度の小さな物体(酵母細胞)のた … 続きを読む

カテゴリー: cs.AI, cs.CV | An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images はコメントを受け付けていません

Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks

要約 コンピュータビジョンで重要な役割を果たす人間の動きの予測は、通常、入力とし … 続きを読む

カテゴリー: cs.CV | Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks はコメントを受け付けていません

Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos

要約 ディープラーニングの登場により、画像データからの単眼3D顔再構成に関する最 … 続きを読む

カテゴリー: cs.CV | Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos はコメントを受け付けていません

Multi-temporal speckle reduction with self-supervised deep neural networks

要約 スペックルフィルタリングは、通常、合成開口レーダー(SAR)画像の分析の前 … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-temporal speckle reduction with self-supervised deep neural networks はコメントを受け付けていません