-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and Heuristic Rule-based Methods for Object Manipulation
要約 このホワイトペーパーでは、SAPIEN ManiSkill Challen … 続きを読む
Exploring Structure-aware Transformer over Interaction Proposals for Human-Object Interaction Detection
要約 最近の高性能な人間と物体の相互作用(HOI)検出技術は、Transform … 続きを読む
MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing
要約 畳み込みニューラルネットワーク(CNN)は、視覚認識の頼りになるモデルと見 … 続きを読む
A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications
要約 人間の行動を理解するには、ビデオに基づく行動認識が一般的なアプローチです。 … 続きを読む
A DTCWT-SVD Based Video Watermarking resistant to frame rate conversion
要約 攻撃者は、ビデオを簡単に改ざん、コピー、再配布して、違法な金銭的使用を行う … 続きを読む
DE-Net: Dynamic Text-guided Image Editing Adversarial Networks
要約 テキストガイド付き画像編集モデルは、驚くべき結果を示しています。 ただし、 … 続きを読む
Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature Alignment
要約 少数ショットオブジェクト検出(FSOD)は、いくつかの例のみを使用してオブ … 続きを読む
PTCT: Patches with 3D-Temporal Convolutional Transformer Network for Precipitation Nowcasting
要約 降水ナウキャストは、主にレーダーエコーシーケンスの予測に依存する、短期間の … 続きを読む
All One Needs to Know about Priors for Deep Image Restoration and Enhancement: A Survey
要約 画像の復元と強調は、ノイズ、ブラー、解像度の低下などの劣化を取り除くことに … 続きを読む
Scene Aware Person Image Generation through Global Contextual Conditioning
要約 人物画像生成は、興味深いが挑戦的な問題である。しかし、このタスクは制約のあ … 続きを読む