-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Leveraging Modality-specific Representations for Audio-visual Speech Recognition via Reinforcement Learning
要約 視聴覚音声認識 (AVSR) は、音声認識のノイズ ロバスト性を改善するた … 続きを読む
mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video
要約 近年、言語、ビジョン、およびマルチモーダル事前トレーニングの大きな収束が見 … 続きを読む
Sport Task: Fine Grained Action Detection and Classification of Table Tennis Strokes from Videos for MediaEval 2022
要約 スポーツ ビデオの分析は、広く行われている研究テーマです。 そのアプリケー … 続きを読む
Zero3D: Semantic-Driven Multi-Category 3D Shape Generation
要約 セマンティック主導の 3D 形状生成は、テキストに基づいて調整された 3D … 続きを読む
M3FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing System
要約 フェイス スプーフィングとしても知られるフェイス プレゼンテーション攻撃 … 続きを読む
Inter-View Depth Consistency Testing in Depth Difference Subspace
要約 マルチビュー深度画像は、自由視点テレビで重要な役割を果たします。 この技術 … 続きを読む
On the Importance of Noise Scheduling for Diffusion Models
要約 拡散生成モデルのノイズを除去するためのノイズスケジューリング戦略の効果を経 … 続きを読む
On the Importance of Noise Scheduling for Diffusion Models
要約 拡散生成モデルのノイズを除去するためのノイズスケジューリング戦略の効果を経 … 続きを読む
Learning from Mistakes: Self-Regularizing Hierarchical Semantic Representations in Point Cloud Segmentation
要約 自律ロボット技術の最近の進歩により、正確な環境分析の必要性が高まっています … 続きを読む
Self-Supervised RGB-T Tracking with Cross-Input Consistency
要約 本稿では、自己教師あり RGB-T 追跡法を提案します。 トレーニングに多 … 続きを読む