cs.LG」カテゴリーアーカイブ

HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving

要約 大規模な言語モデル(LLMS)と強化学習(RL)を統合すると、複雑なシナリ … 続きを読む

カテゴリー: cs.LG, cs.RO | HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving はコメントを受け付けていません

Multi-modal Integration Analysis of Alzheimer’s Disease Using Large Language Models and Knowledge Graphs

要約 大規模な言語モデル(LLMS)と知識グラフを使用したアルツハイマー病(AD … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.1 | Multi-modal Integration Analysis of Alzheimer’s Disease Using Large Language Models and Knowledge Graphs はコメントを受け付けていません

AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation

要約 新しい実施形態に対する制御ポリシーの一般化は、ロボット工学におけるスケーラ … 続きを読む

カテゴリー: cs.LG, cs.RO | AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation はコメントを受け付けていません

Learning-based Airflow Inertial Odometry for MAVs using Thermal Anemometers in a GPS and vision denied environment

要約 この作業は、熱風速計、IMU、ESC、気圧計を含むマルチセンサーデータ融合 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Learning-based Airflow Inertial Odometry for MAVs using Thermal Anemometers in a GPS and vision denied environment はコメントを受け付けていません

Learning Novel Skills from Language-Generated Demonstrations

要約 ロボットは、新しいスキルを必要とするタスクに取り組むために、多様なドメイン … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Learning Novel Skills from Language-Generated Demonstrations はコメントを受け付けていません

Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers

要約 最新のディープポリシーグラディエントメソッドは、シミュレートされたロボット … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers はコメントを受け付けていません

Cascaded Diffusion Models for Neural Motion Planning

要約 現実の世界のロボットは、衝突せずに複雑な環境の目標を認識して移動する必要が … 続きを読む

カテゴリー: cs.LG, cs.RO | Cascaded Diffusion Models for Neural Motion Planning はコメントを受け付けていません

Learning-based Autonomous Oversteer Control and Collision Avoidance

要約 車両の後部タイヤが牽引力を失い、意図しない過度のヨーを誘発するオーバーステ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Learning-based Autonomous Oversteer Control and Collision Avoidance はコメントを受け付けていません

ABPT: Amended Backpropagation through Time with Partially Differentiable Rewards

要約 四肢装置制御ポリシーは、報酬の正確な勾配を使用して高性能でトレーニングする … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | ABPT: Amended Backpropagation through Time with Partially Differentiable Rewards はコメントを受け付けていません

Guided Policy Optimization under Partial Observability

要約 部分的に観察可能な環境での強化学習(RL)は、不確実性の下での学習の複雑さ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Guided Policy Optimization under Partial Observability はコメントを受け付けていません