「cs.LG」カテゴリーアーカイブ

Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies

投稿日: 2024年10月23日作成者: jarxiv

要約強化学習 (RL) ポリシーは高周波の変動を起こしやすく、現実世界のハード … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments

投稿日: 2024年10月23日作成者: jarxiv

要約未知の環境を探索する自律ロボットは、事前の地図なしで、限られた外部フィード … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

QuasiNav: Asymmetric Cost-Aware Navigation Planning with Constrained Quasimetric Reinforcement Learning

投稿日: 2024年10月23日作成者: jarxiv

要約構造化されていない屋外環境での自律ナビゲーションは、上り坂と下り坂の移動で … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Sample-Efficient Curriculum Reinforcement Learning for Complex Reward Functions

投稿日: 2024年10月23日作成者: jarxiv

要約強化学習 (RL) は制御問題において有望ですが、制約のある複雑な報酬関数 … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning

投稿日: 2024年10月23日作成者: jarxiv

要約ロボット学習では、さまざまなモダリティの明確な特性により観察空間が非常に重 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI

投稿日: 2024年10月23日作成者: jarxiv

要約近年、Large Language Model（LLM）は高い推論能力を発 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | コメントを受け付けていません

PRIMER: Perception-Aware Robust Learning-based Multiagent Trajectory Planner

投稿日: 2024年10月23日作成者: jarxiv

要約分散型マルチエージェント軌道プランナーでは、衝突のない軌道を生成するために … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret

投稿日: 2024年10月23日作成者: jarxiv

要約大規模なテンソル学習アルゴリズムは通常、計算コストが高く、膨大な量のデータ … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Optimal Design for Reward Modeling in RLHF

投稿日: 2024年10月23日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

投稿日: 2024年10月23日作成者: jarxiv

要約言語モデルは、画像、ビデオ、音声、オーディオなどの自然信号のモデル化に効果 … 続きを読む →

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS, eess.SP | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies

TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments

QuasiNav: Asymmetric Cost-Aware Navigation Planning with Constrained Quasimetric Reinforcement Learning

Sample-Efficient Curriculum Reinforcement Learning for Complex Reward Functions

Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning

EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI

PRIMER: Perception-Aware Robust Learning-based Multiagent Trajectory Planner

Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret

Optimal Design for Reward Modeling in RLHF

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

最近の投稿

最近のコメント

アーカイブ

カテゴリー