-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは、人間の感情と認識の重要な要素です。 その自動理解は、より自然な … 続きを読む
Marine Video Kit: A New Marine Video Dataset for Content-based Analysis and Retrieval
要約 異常なドメイン固有のビデオ コレクションの効果的な分析は、最先端の汎用モデ … 続きを読む
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering
要約 Text-based Visual Question Answering~ … 続きを読む
CorrI2P: Deep Image-to-Point Cloud Registration via Dense Correspondence
要約 対応する 3D 点群で 2D 画像をローカライズする重要なステップは、それ … 続きを読む
Learning to Evaluate Performance of Multi-modal Semantic Localization
要約 セマンティック ローカリゼーション (SeLo) は、テキストなどのセマン … 続きを読む
AutoLV: Automatic Lecture Video Generator
要約 注釈付きスライド、講師の参照音声、講師の参照ポートレート ビデオから直接、 … 続きを読む
Rethinking Data Augmentation for Robust Visual Question Answering
要約 元のトレーニング セットを超える追加のトレーニング サンプルを生成する D … 続きを読む
Learning to Evaluate Performance of Multi-modal Semantic Localization
要約 セマンティック ローカリゼーション (SeLo) は、テキストなどのセマン … 続きを読む
Learning to Evaluate Performance of Multi-modal Semantic Localization
要約 セマンティック ローカリゼーション (SeLo) は、テキストなどのセマン … 続きを読む