cs.AI」カテゴリーアーカイブ

Vision-Language Models under Cultural and Inclusive Considerations

要約 大規模視覚言語モデル (VLM) は、視覚障害のある人々の日常生活の画像を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY | Vision-Language Models under Cultural and Inclusive Considerations はコメントを受け付けていません

Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision

要約 Large Vision Language Model (LVLM) のパ … 続きを読む

カテゴリー: cs.AI, cs.CV | Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision はコメントを受け付けていません

Multi-Object Hallucination in Vision-Language Models

要約 Large Vision Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Multi-Object Hallucination in Vision-Language Models はコメントを受け付けていません

EventChat: Implementation and user-centric evaluation of a large language model-driven conversational recommender system for exploring leisure events in an SME context

要約 大規模言語モデル (LLM) は、会話型レコメンダー システム (CRS) … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.IR, cs.LG, H.5.2 | EventChat: Implementation and user-centric evaluation of a large language model-driven conversational recommender system for exploring leisure events in an SME context はコメントを受け付けていません

PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers

要約 オブジェクトの部分を明示的に検出し、それを基に推論するコンピューター ビジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers はコメントを受け付けていません

Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning

要約 惑星探査では、起伏の激しい地形での移動が必要となる。さらに、火星探査機やそ … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.9 | Autonomous Control of a Novel Closed Chain Five Bar Active Suspension via Deep Reinforcement Learning はコメントを受け付けていません

DexCap: Scalable and Portable Mocap Data Collection System for Dexterous Manipulation

要約 人間の手の動きデータからの模倣学習は、実世界の操作タスクにおいて人間のよう … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DexCap: Scalable and Portable Mocap Data Collection System for Dexterous Manipulation はコメントを受け付けていません

Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions

要約 Vision-and-Language Navigation (VLN)は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions はコメントを受け付けていません

Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks

要約 マルチモーダルモデルの汎化能力を、分布外データに対する性能のみに基づいて評 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | Investigating the Role of Instruction Variety and Task Difficulty in Robotic Manipulation Tasks はコメントを受け付けていません

ROER: Regularized Optimal Experience Replay

要約 経験再生はオンライン強化学習(RL)の成功の鍵となる要素である。優先経験再 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | ROER: Regularized Optimal Experience Replay はコメントを受け付けていません