-
最近の投稿
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
- OrbitGrasp: $SE(3)$-Equivariant Grasp Learning
- M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
- Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment
- Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing
-
最近のコメント
表示できるコメントはありません。 cs.AI (28126) cs.CL (21249) cs.CR (2197) cs.CV (34799) cs.LG (32858) cs.RO (16174) cs.SY (2496) eess.IV (4244) eess.SY (2490) stat.ML (4401)
「cs.MM」カテゴリーアーカイブ
Exploring Structure-aware Transformer over Interaction Proposals for Human-Object Interaction Detection
要約 最近の高性能な人間と物体の相互作用(HOI)検出技術は、Transform … 続きを読む
MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing
要約 畳み込みニューラルネットワーク(CNN)は、視覚認識の頼りになるモデルと見 … 続きを読む
A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications
要約 人間の行動を理解するには、ビデオに基づく行動認識が一般的なアプローチです。 … 続きを読む
A DTCWT-SVD Based Video Watermarking resistant to frame rate conversion
要約 攻撃者は、ビデオを簡単に改ざん、コピー、再配布して、違法な金銭的使用を行う … 続きを読む
DE-Net: Dynamic Text-guided Image Editing Adversarial Networks
要約 テキストガイド付き画像編集モデルは、驚くべき結果を示しています。 ただし、 … 続きを読む
Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature Alignment
要約 少数ショットオブジェクト検出(FSOD)は、いくつかの例のみを使用してオブ … 続きを読む
PTCT: Patches with 3D-Temporal Convolutional Transformer Network for Precipitation Nowcasting
要約 降水ナウキャストは、主にレーダーエコーシーケンスの予測に依存する、短期間の … 続きを読む
All One Needs to Know about Priors for Deep Image Restoration and Enhancement: A Survey
要約 画像の復元と強調は、ノイズ、ブラー、解像度の低下などの劣化を取り除くことに … 続きを読む
Scene Aware Person Image Generation through Global Contextual Conditioning
要約 人物画像生成は、興味深いが挑戦的な問題である。しかし、このタスクは制約のあ … 続きを読む
Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation
要約 参照ビデオオブジェクトのセグメンテーションは、ビデオ内の自然言語表現によっ … 続きを読む