「cs.LG」カテゴリーアーカイブ

Online MDP with Transition Prototypes: A Robust Adaptive Approach

投稿日: 2024年12月20日作成者: jarxiv

要約この研究では、基盤となる遷移カーネルの有限個のプロトタイプの情報を持ってい … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting

投稿日: 2024年12月20日作成者: jarxiv

要約 LLM はさまざまなタスクで優れたパフォーマンスを発揮するため広く使用され … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective

投稿日: 2024年12月20日作成者: jarxiv

要約滑らかな活性化関数を使用してニューラルネットワークをトレーニングするため … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY, math.OC, stat.ML | コメントを受け付けていません

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

投稿日: 2024年12月20日作成者: jarxiv

要約画像生成用の連続トークンを使用した自己回帰 (AR) モデルの最近の進歩に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback

投稿日: 2024年12月19日作成者: jarxiv

要約自然言語記述からの高密度報酬の自動合成は、強化学習 (RL) における有望 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | コメントを受け付けていません

Exploring Transformer-Augmented LSTM for Temporal and Spatial Feature Learning in Trajectory Prediction

投稿日: 2024年12月19日作成者: jarxiv

要約安全で効率的な自動運転を確保するには、正確な車両軌道予測が不可欠です。こ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Efficient Language-instructed Skill Acquisition via Reward-Policy Co-Evolution

投稿日: 2024年12月19日作成者: jarxiv

要約人間による最小限の指導で自律的にタスクを探索し解決する能力は、身体化された … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model

投稿日: 2024年12月19日作成者: jarxiv

要約ロボット学習の最近の進歩では、大規模なモデルと広範なデモンストレーションを … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection

投稿日: 2024年12月19日作成者: jarxiv

要約不確実な部分観察から多様な器用な把握を総合することは、物理的知性の実施形態 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

When Should We Prefer State-to-Visual DAgger Over Visual Reinforcement Learning?

投稿日: 2024年12月19日作成者: jarxiv

要約ピクセルや点群などの高次元の視覚入力からポリシーを学習することは、さまざま … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Online MDP with Transition Prototypes: A Robust Adaptive Approach

RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting

Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback

Exploring Transformer-Augmented LSTM for Temporal and Spatial Feature Learning in Trajectory Prediction

Efficient Language-instructed Skill Acquisition via Reward-Policy Co-Evolution

Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model

FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection

When Should We Prefer State-to-Visual DAgger Over Visual Reinforcement Learning?

最近の投稿

最近のコメント

アーカイブ

カテゴリー