I.2.6」カテゴリーアーカイブ

Chameleon: A MatMul-Free Temporal Convolutional Network Accelerator for End-to-End Few-Shot and Continual Learning from Sequential Data

要約 エッジでのデバイス上の学習により、長期的な堅牢性が向上し、メンテナンスコス … 続きを読む

カテゴリー: cs.AR, cs.LG, I.2.6 | Chameleon: A MatMul-Free Temporal Convolutional Network Accelerator for End-to-End Few-Shot and Continual Learning from Sequential Data はコメントを受け付けていません

Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning

要約 モデルの蒸留の最近の進歩は、高度な推論モデルからのデータ(例:Deepse … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.6 | Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning はコメントを受け付けていません

Learning coordinated badminton skills for legged manipulators

要約 下肢と上肢の間の動きを調整し、手足の制御を認識と調整することは、特に動的環 … 続きを読む

カテゴリー: 68T40, 93C85, cs.LG, cs.RO, I.2.6 | Learning coordinated badminton skills for legged manipulators はコメントを受け付けていません

Equivariant Representation Learning for Symmetry-Aware Inference with Guarantees

要約 回帰、条件付き確率推定、および不確実性の定量化の多くの現実世界の応用では、 … 続きを読む

カテゴリー: 43-06, cs.AI, cs.LG, cs.RO, I.2.6 | Equivariant Representation Learning for Symmetry-Aware Inference with Guarantees はコメントを受け付けていません

Improving Value Estimation Critically Enhances Vanilla Policy Gradient

要約 TRPOやPPOなどの最新の政策勾配アルゴリズムは、多くのRLタスクでバニ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, I.2.6 | Improving Value Estimation Critically Enhances Vanilla Policy Gradient はコメントを受け付けていません

Equivariant Representation Learning for Symmetry-Aware Inference with Guarantees

要約 回帰、条件付き確率推定、および不確実性の定量化の多くの現実世界の応用では、 … 続きを読む

カテゴリー: 43-06, cs.AI, cs.LG, cs.RO, I.2.6 | Equivariant Representation Learning for Symmetry-Aware Inference with Guarantees はコメントを受け付けていません

LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios

要約 堅牢で安全で適応的なモーションプランナーに対する自律的な運転研究の最近の進 … 続きを読む

カテゴリー: 68T05, cs.AI, cs.RO, I.2.6 | LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios はコメントを受け付けていません

Leveraging KANs for Expedient Training of Multichannel MLPs via Preconditioning and Geometric Refinement

要約 多層パーセプロン(MLP)は、さまざまな現代の深い学習フレームワークで使用 … 続きを読む

カテゴリー: 68T99, cs.AI, cs.LG, I.2.6 | Leveraging KANs for Expedient Training of Multichannel MLPs via Preconditioning and Geometric Refinement はコメントを受け付けていません

Evaluating Model Explanations without Ground Truth

要約 単一のモデル予測については、多くの競合する矛盾した説明があり、使用するもの … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.6 | Evaluating Model Explanations without Ground Truth はコメントを受け付けていません

Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM

要約 PDDLベースのシンボリックタスク計画は、ロボットの自律性にとって極めて重 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, I.2.6 | Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM はコメントを受け付けていません