cs.LG」カテゴリーアーカイブ

M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes

要約 我々は、モバイル操作タスクのための全身動作生成の新しいベンチマークである … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes はコメントを受け付けていません

Harmonic Mobile Manipulation

要約 最近のロボット工学の進歩により、ロボットは複雑なシーンをナビゲートしたり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Harmonic Mobile Manipulation はコメントを受け付けていません

Disentangled Unsupervised Skill Discovery for Efficient Hierarchical Reinforcement Learning

要約 インテリジェント エージェントの特徴は、環境との監視されていない対話から純 … 続きを読む

カテゴリー: cs.LG, cs.RO | Disentangled Unsupervised Skill Discovery for Efficient Hierarchical Reinforcement Learning はコメントを受け付けていません

DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation

要約 我々は、拡散モデルに基づく適応再評価による暗黙的 Q 学習 (DIAR) … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation はコメントを受け付けていません

DODT: Enhanced Online Decision Transformer Learning through Dreamer’s Actor-Critic Trajectory Forecasting

要約 強化学習の進歩により、複雑な意思決定タスクを学習できる洗練されたモデルが開 … 続きを読む

カテゴリー: cs.LG, cs.RO, stat.ML | DODT: Enhanced Online Decision Transformer Learning through Dreamer’s Actor-Critic Trajectory Forecasting はコメントを受け付けていません

Equivariant Diffusion Policy

要約 最近の研究では、拡散モデルが、動作クローニングにおけるデモンストレーション … 続きを読む

カテゴリー: cs.LG, cs.RO | Equivariant Diffusion Policy はコメントを受け付けていません

Safety Filtering While Training: Improving the Performance and Sample Efficiency of Reinforcement Learning Agents

要約 強化学習 (RL) コントローラーは柔軟性とパフォーマンスに優れていますが … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Safety Filtering While Training: Improving the Performance and Sample Efficiency of Reinforcement Learning Agents はコメントを受け付けていません

An Experimental Design for Anytime-Valid Causal Inference on Multi-Armed Bandits

要約 管理者が変更の価値を厳密に定量化し、それが現状から統計的に有意な改善につな … 続きを読む

カテゴリー: cs.LG, stat.ME | An Experimental Design for Anytime-Valid Causal Inference on Multi-Armed Bandits はコメントを受け付けていません

On the potential of Optimal Transport in Geospatial Data Science

要約 地理情報科学と交通における予測問題は、多くの場合、業務効率を向上させる可能 … 続きを読む

カテゴリー: cs.CE, cs.LG | On the potential of Optimal Transport in Geospatial Data Science はコメントを受け付けていません

Zero-shot Model-based Reinforcement Learning using Large Language Models

要約 大規模言語モデル (LLM) の新たなゼロショット機能により、自然言語処理 … 続きを読む

カテゴリー: cs.LG, stat.ML | Zero-shot Model-based Reinforcement Learning using Large Language Models はコメントを受け付けていません