-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies
要約 強化学習 (RL) ポリシーは高周波の変動を起こしやすく、現実世界のハード … 続きを読む
TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments
要約 未知の環境を探索する自律ロボットは、事前の地図なしで、限られた外部フィード … 続きを読む
QuasiNav: Asymmetric Cost-Aware Navigation Planning with Constrained Quasimetric Reinforcement Learning
要約 構造化されていない屋外環境での自律ナビゲーションは、上り坂と下り坂の移動で … 続きを読む
Sample-Efficient Curriculum Reinforcement Learning for Complex Reward Functions
要約 強化学習 (RL) は制御問題において有望ですが、制約のある複雑な報酬関数 … 続きを読む
Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning
要約 ロボット学習では、さまざまなモダリティの明確な特性により観察空間が非常に重 … 続きを読む
EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI
要約 近年、Large Language Model(LLM)は高い推論能力を発 … 続きを読む
PRIMER: Perception-Aware Robust Learning-based Multiagent Trajectory Planner
要約 分散型マルチエージェント軌道プランナーでは、衝突のない軌道を生成するために … 続きを読む
Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret
要約 大規模なテンソル学習アルゴリズムは通常、計算コストが高く、膨大な量のデータ … 続きを読む
Optimal Design for Reward Modeling in RLHF
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む