-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.AI」カテゴリーアーカイブ
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design
要約 私たちは、エンジニアリング設計でディープジェネレーティブモデル (DGM) … 続きを読む
ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis
要約 ボランティア地理情報 (VGI) は、その種類が豊富で、大容量で、迅速な更 … 続きを読む
Benchmarking Domain Generalization Algorithms in Computational Pathology
要約 深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であ … 続きを読む
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification
要約 自然信号の主観的な品質は、客観的な知覚指標で近似できます。 人間の観察者の … 続きを読む
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification
要約 医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む
LingoQA: Video Question Answering for Autonomous Driving
要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む
Unveiling Ontological Commitment in Multi-Modal Foundation Models
要約 存在論的コミットメント、つまり使用される概念、関係、仮定は、定性的推論 ( … 続きを読む
Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation
要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む
Attention Prompting on Image for Large Vision-Language Models
要約 大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む
Stochastic Multi-round Submodular Optimization with Budget
要約 この研究では、確率的予算付きマルチラウンド サブモジュラー最大化 (SBM … 続きを読む