-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
月別アーカイブ: 2025年3月
Autonomous AI imitators increase diversity in homogeneous information ecosystems
要約 大規模な言語モデル(LLMS)の最近のブレークスルーにより、人間が生成した … 続きを読む
CoSIL: Software Issue Localization via LLM-Driven Code Repository Graph Searching
要約 大規模な言語モデル(LLMS)は、自律的なソフトウェアエンジニアリングを大 … 続きを読む
A Causal Framework to Measure and Mitigate Non-binary Treatment Discrimination
要約 アルゴリズムの意思決定システムの公平性研究では、しばしば保釈やローンの承認 … 続きを読む
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning
要約 エントロピー誘導シーケンス重み付け(EGSW)を導入します。これは、強化学 … 続きを読む
Evaluating LLM-based Agents for Multi-Turn Conversations: A Survey
要約 この調査では、マルチターン会話設定の大規模な言語モデル(LLM)ベースのエ … 続きを読む
LoRD: Adapting Differentiable Driving Policies to Distribution Shifts
要約 運用ドメイン間の分布シフトは、自動運転車(SDV)の学習モデルの性能に深刻 … 続きを読む
Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent
要約 確率的勾配降下の挙動は、SGDが純粋にベイジアンの方法でフラクタル次元を説 … 続きを読む
Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving
要約 強化学習(RL)は、自律運転の意思決定と制御の問題を解決する上で優れたパフ … 続きを読む
Robust Offline Imitation Learning Through State-level Trajectory Stitching
要約 模倣学習(IL)は、専門家のデモンストレーションを通じてロボットが視覚運動 … 続きを読む
SafeCast: Risk-Responsive Motion Forecasting for Autonomous Vehicles
要約 正確なモーション予測は、自律運転(AD)システムの安全性と信頼性に不可欠で … 続きを読む