cs.LG」カテゴリーアーカイブ

Fast Convergence of Softmax Policy Mirror Ascent

要約 自然ポリシー勾配 (NPG) は一般的なポリシー最適化アルゴリズムであり、 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

SAFE-GIL: SAFEty Guided Imitation Learning for Robotic Systems

要約 行動クローニング (BC) は、模倣学習で広く使用されているアプローチであ … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | コメントする

HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments

要約 私たちは、廊下や家具などの環境上の制約がある密集したインタラクティブな群衆 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning

要約 ロボット タスクで強化学習 (RL) エージェントをトレーニングするには、 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

Error-Feedback Model for Output Correction in Bilateral Control-Based Imitation Learning

要約 近年、ニューラルネットワークを用いた模倣学習により、ロボットは柔軟なタスク … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

SNN-Based Online Learning of Concepts and Action Laws in an Open World

要約 我々は、エージェントの意味記憶を実装するスパイキング ニューラル ネットワ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO | コメントする

MaIL: Improving Imitation Learning with Mamba

要約 この研究では、最先端 (SoTA) Transformer ベースのポリシ … 続きを読む

カテゴリー: cs.LG, cs.RO | コメントする

Partially Unitary Learning

要約 一連の波動関数測定値に基づく $\left|\psi\right\rang … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA, quant-ph, stat.ML | コメントする

Stream-Based Active Learning for Process Monitoring

要約 統計的プロセス監視 (SPM) 手法は、工業プロセスの安定性をチェックする … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Approximating Families of Sharp Solutions to Fisher’s Equation with Physics-Informed Neural Networks

要約 この論文では、フィッシャー方程式を解くために物理情報に基づくニューラル ネ … 続きを読む

カテゴリー: cs.LG | コメントする