cs.LG」カテゴリーアーカイブ

Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies

要約 強化学習 (RL) ポリシーは高周波の変動を起こしやすく、現実世界のハード … 続きを読む

カテゴリー: cs.LG, cs.RO | Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies はコメントを受け付けていません

TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments

要約 未知の環境を探索する自律ロボットは、事前の地図なしで、限られた外部フィード … 続きを読む

カテゴリー: cs.LG, cs.RO | TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments はコメントを受け付けていません

QuasiNav: Asymmetric Cost-Aware Navigation Planning with Constrained Quasimetric Reinforcement Learning

要約 構造化されていない屋外環境での自律ナビゲーションは、上り坂と下り坂の移動で … 続きを読む

カテゴリー: cs.LG, cs.RO | QuasiNav: Asymmetric Cost-Aware Navigation Planning with Constrained Quasimetric Reinforcement Learning はコメントを受け付けていません

Sample-Efficient Curriculum Reinforcement Learning for Complex Reward Functions

要約 強化学習 (RL) は制御問題において有望ですが、制約のある複雑な報酬関数 … 続きを読む

カテゴリー: cs.LG, cs.RO | Sample-Efficient Curriculum Reinforcement Learning for Complex Reward Functions はコメントを受け付けていません

Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning

要約 ロボット学習では、さまざまなモダリティの明確な特性により観察空間が非常に重 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning はコメントを受け付けていません

EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI

要約 近年、Large Language Model(LLM)は高い推論能力を発 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI はコメントを受け付けていません

PRIMER: Perception-Aware Robust Learning-based Multiagent Trajectory Planner

要約 分散型マルチエージェント軌道プランナーでは、衝突のない軌道を生成するために … 続きを読む

カテゴリー: cs.LG, cs.RO | PRIMER: Perception-Aware Robust Learning-based Multiagent Trajectory Planner はコメントを受け付けていません

Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret

要約 大規模なテンソル学習アルゴリズムは通常、計算コストが高く、膨大な量のデータ … 続きを読む

カテゴリー: cs.LG, stat.ML | Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret はコメントを受け付けていません

Optimal Design for Reward Modeling in RLHF

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む

カテゴリー: cs.LG, stat.ML | Optimal Design for Reward Modeling in RLHF はコメントを受け付けていません

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

要約 言語モデルは、画像、ビデオ、音声、オーディオなどの自然信号のモデル化に効果 … 続きを読む

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS, eess.SP | WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling はコメントを受け付けていません