-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2022年7月
BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis
要約 オーディオ調整されたダンスモーション合成の生成モデルは、音楽機能をダンスの … 続きを読む
カテゴリー: cs.CV
BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis はコメントを受け付けていません
3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal
要約 人間の行動を理解するには、単一のRGB画像から3Dの相互作用する手のポーズ … 続きを読む
カテゴリー: cs.CV
3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal はコメントを受け付けていません
Hierarchical Average Precision Training for Pertinent Image Retrieval
要約 画像検索は通常、平均適合率(AP)または再現率@kで評価されます。 ただし … 続きを読む
AiATrack: Attention in Attention for Transformer Visual Tracking
要約 Transformerトラッカーは最近目覚ましい進歩を遂げており、注意メカ … 続きを読む
カテゴリー: cs.CV
AiATrack: Attention in Attention for Transformer Visual Tracking はコメントを受け付けていません
RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos
要約 ピクセル単位のフローラベルの手動注釈は法外に費用がかかり、手間がかかるため … 続きを読む
カテゴリー: cs.CV
RealFlow: EM-based Realistic Optical Flow Dataset Generation from Videos はコメントを受け付けていません
Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining
要約 人間は通常、顔の表情によって自発的または非自発的に感情を伝えます。 顔の画 … 続きを読む
カテゴリー: cs.CV
Facial Expression Recognition using Vanilla ViT backbones with MAE Pretraining はコメントを受け付けていません
An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images
要約 この論文は、より高い精度でタスクを数える高密度の小さな物体(酵母細胞)のた … 続きを読む
Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks
要約 コンピュータビジョンで重要な役割を果たす人間の動きの予測は、通常、入力とし … 続きを読む
カテゴリー: cs.CV
Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks はコメントを受け付けていません
Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos
要約 ディープラーニングの登場により、画像データからの単眼3D顔再構成に関する最 … 続きを読む
カテゴリー: cs.CV
Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos はコメントを受け付けていません
Multi-temporal speckle reduction with self-supervised deep neural networks
要約 スペックルフィルタリングは、通常、合成開口レーダー(SAR)画像の分析の前 … 続きを読む