-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
MultiZoo & MultiBench: A Standardized Toolkit for Multimodal Deep Learning
要約 マルチモーダル表現の学習には、複数の異種データ ソースからの情報を統合する … 続きを読む
Cross-Attention is Not Enough: Incongruity-Aware Hierarchical Multimodal Sentiment Analysis and Emotion Recognition
要約 感情的なコンピューティング タスクに複数のモダリティを融合することは、パフ … 続きを読む
Movie101: A New Movie Understanding Benchmark
要約 視覚障害者が映画を楽しめるよう、自動映画ナレーション システムは、俳優のセ … 続きを読む
You Can Mask More For Extremely Low-Bitrate Image Compression
要約 学習済み画像圧縮 (LIC) 手法は、近年大幅な進歩を遂げています。 ただ … 続きを読む
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3
要約 このレポートでは、サウンド デミキシング チャレンジ 2023 の音楽デミ … 続きを読む
Aligning Large Multi-Modal Model with Robust Instruction Tuning
要約 マルチモーダル タスクにおける有望な進歩にもかかわらず、現在の大規模マルチ … 続きを読む
FunQA: Towards Surprising Video Comprehension
要約 面白いクリップ、創造的なパフォーマンス、視覚的な錯覚など、驚くべきビデオは … 続きを読む
TACOformer:Token-channel compounded Cross Attention for Multimodal Emotion Recognition
要約 最近、生理学的信号に基づく感情認識が集中的に研究されている分野として浮上し … 続きを読む
On Uni-Modal Feature Learning in Supervised Multi-Modal Learning
要約 マルチモーダル データの特徴 (つまり、学習された表現) を、1) ユニモ … 続きを読む
DiffWA: Diffusion Models for Watermark Attack
要約 ディープ ニューラル ネットワーク (DNN) の急速な発展に伴い、多くの … 続きを読む