-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
Egocentric Audio-Visual Object Localization
要約 人間は、音と視覚を統合して一人称視点で周囲の景色を自然に知覚します。 同様 … 続きを読む
Positive-Augmented Constrastive Learning for Image and Video Captioning Evaluation
要約 CLIP モデルは最近、視覚と言語のアーキテクチャから生成されたキャプショ … 続きを読む
Reliable and Efficient Evaluation of Adversarial Robustness for Deep Hashing-Based Retrieval
要約 ディープ ハッシングは、その効率と有効性から大量の画像検索に広く適用されて … 続きを読む
A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?
要約 ChatGPT が口コミで広まるにつれ、ジェネレーティブ AI (AIGC … 続きを読む
GPT4MIA: Utilizing Generative Pre-trained Transformer (GPT-3) as A Plug-and-Play Transductive Model for Medical Image Analysis
要約 この論文では、医用画像解析 (MIA) 用のプラグアンドプレイ変換推論ツー … 続きを読む
PheME: A deep ensemble framework for improving phenotype prediction from multi-modal data
要約 詳細な表現型情報は、疾患の正確な診断とリスク推定に不可欠です。 表現型情報 … 続きを読む
GraphCFC: A Directed Graph based Cross-modal Feature Complementation Approach for Multimodal Conversational Emotion Recognition
要約 会話における感情認識 (ERC) は、共感的なサービスを提供できるため、ヒ … 続きを読む
Multitrack Music Transformer
要約 変圧器モデルを使用してマルチトラック音楽を生成するための既存のアプローチは … 続きを読む
T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models
要約 大規模な text-to-image (T2I) モデルの信じられないほど … 続きを読む
GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation
要約 拡散プロセスに基づくテキストから画像 (T2I) モデルは、ユーザー提供の … 続きを読む