-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
Fusion-S2iGan: An Efficient and Effective Single-Stage Framework for Speech-to-Image Generation
要約 音声から画像への変換の目的は、音声信号から直接フォトリアリスティックな画像 … 続きを読む
NFI$_2$: Learning Noise-Free Illuminance-Interpolator for Unsupervised Low-Light Image Enhancement
要約 低照度の状況では、消費者向け写真における美的品質の追求が大幅に制限されます … 続きを読む
From Region to Patch: Attribute-Aware Foreground-Background Contrastive Learning for Fine-Grained Fashion Retrieval
要約 属性固有のファッション検索 (ASFR) は、近年ますます注目を集めている … 続きを読む
Evaluating Object Hallucination in Large Vision-Language Models
要約 大規模言語モデル (LLM) の優れた言語能力に触発され、複雑なマルチモー … 続きを読む
Continual Multimodal Knowledge Graph Construction
要約 マルチモーダル ナレッジ グラフ構築 (MMKC) とは、テキスト、画像、 … 続きを読む
HFLIC: Human Friendly Perceptual Learned Image Compression with Reinforced Transform
要約 近年、評価歪み-知覚圧縮を優先し、低ビットレートでも微細なディテールを保持 … 続きを読む
Interpretable multimodal sentiment analysis based on textual modality descriptions by using large-scale language models
要約 マルチモーダル感情分析は、ユーザーの内面を理解する上で重要な分野である。深 … 続きを読む
HFLIC: Human Friendly Perceptual Learned Image Compression with Reinforced Transform
要約 近年、評価歪み-知覚圧縮を優先し、低ビットレートでも微細なディテールを保持 … 続きを読む
GAMIVAL: Video Quality Prediction on Mobile Cloud Gaming Content
要約 モバイルクラウドゲーム業界は、ここ10年で急速に成長している。クラウドサー … 続きを読む