cs.LG」カテゴリーアーカイブ

Online MDP with Transition Prototypes: A Robust Adaptive Approach

要約 この研究では、基盤となる遷移カーネルの有限個のプロトタイプの情報を持ってい … 続きを読む

カテゴリー: cs.LG | Online MDP with Transition Prototypes: A Robust Adaptive Approach はコメントを受け付けていません

RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting

要約 LLM はさまざまなタスクで優れたパフォーマンスを発揮するため広く使用され … 続きを読む

カテゴリー: cs.CL, cs.LG | RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting はコメントを受け付けていません

Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective

要約 滑らかな活性化関数を使用してニューラル ネットワークをトレーニングするため … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY, math.OC, stat.ML | Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective はコメントを受け付けていません

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

要約 画像生成用の連続トークンを使用した自己回帰 (AR) モデルの最近の進歩に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling はコメントを受け付けていません

Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback

要約 自然言語記述からの高密度報酬の自動合成は、強化学習 (RL) における有望 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback はコメントを受け付けていません

Exploring Transformer-Augmented LSTM for Temporal and Spatial Feature Learning in Trajectory Prediction

要約 安全で効率的な自動運転を確保するには、正確な車両軌道予測が不可欠です。 こ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Exploring Transformer-Augmented LSTM for Temporal and Spatial Feature Learning in Trajectory Prediction はコメントを受け付けていません

Efficient Language-instructed Skill Acquisition via Reward-Policy Co-Evolution

要約 人間による最小限の指導で自律的にタスクを探索し解決する能力は、身体化された … 続きを読む

カテゴリー: cs.LG, cs.RO | Efficient Language-instructed Skill Acquisition via Reward-Policy Co-Evolution はコメントを受け付けていません

Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model

要約 ロボット学習の最近の進歩では、大規模なモデルと広範なデモンストレーションを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model はコメントを受け付けていません

FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection

要約 不確実な部分観察から多様な器用な把握を総合することは、物理的知性の実施形態 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection はコメントを受け付けていません

When Should We Prefer State-to-Visual DAgger Over Visual Reinforcement Learning?

要約 ピクセルや点群などの高次元の視覚入力からポリシーを学習することは、さまざま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | When Should We Prefer State-to-Visual DAgger Over Visual Reinforcement Learning? はコメントを受け付けていません