-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Vision-Language Models under Cultural and Inclusive Considerations
要約 大規模視覚言語モデル (VLM) は、視覚障害のある人々の日常生活の画像を … 続きを読む
Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision
要約 Large Vision Language Model (LVLM) のパ … 続きを読む
Multi-Object Hallucination in Vision-Language Models
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
EventChat: Implementation and user-centric evaluation of a large language model-driven conversational recommender system for exploring leisure events in an SME context
要約 大規模言語モデル (LLM) は、会話型レコメンダー システム (CRS) … 続きを読む
PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers
要約 オブジェクトの部分を明示的に検出し、それを基に推論するコンピューター ビジ … 続きを読む
Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning
要約 惑星探査では、起伏の激しい地形での移動が必要となる。さらに、火星探査機やそ … 続きを読む
DexCap: Scalable and Portable Mocap Data Collection System for Dexterous Manipulation
要約 人間の手の動きデータからの模倣学習は、実世界の操作タスクにおいて人間のよう … 続きを読む
Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions
要約 Vision-and-Language Navigation (VLN)は … 続きを読む
Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks
要約 マルチモーダルモデルの汎化能力を、分布外データに対する性能のみに基づいて評 … 続きを読む
ROER: Regularized Optimal Experience Replay
要約 経験再生はオンライン強化学習(RL)の成功の鍵となる要素である。優先経験再 … 続きを読む