cs.LG」カテゴリーアーカイブ

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

要約 数学的問題のための自動化された正式な証明生成で最先端の(SOTA)パフォー … 続きを読む

カテゴリー: cs.AI, cs.LG | Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving はコメントを受け付けていません

A Unifying Framework for Causal Imitation Learning with Hidden Confounders

要約 文献からいくつかの既存の混乱したIL設定を包含する隠された交絡因子を使用し … 続きを読む

カテゴリー: cs.AI, cs.LG | A Unifying Framework for Causal Imitation Learning with Hidden Confounders はコメントを受け付けていません

Programming Refusal with Conditional Activation Steering

要約 LLMは顕著な能力を示していますが、反応行動を正確に制御することは依然とし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Programming Refusal with Conditional Activation Steering はコメントを受け付けていません

Revisiting the Initial Steps in Adaptive Gradient Descent Optimization

要約 Adamなどの適応勾配最適化方法は、より速い収束を達成する能力により、多様 … 続きを読む

カテゴリー: cs.AI, cs.LG | Revisiting the Initial Steps in Adaptive Gradient Descent Optimization はコメントを受け付けていません

Learning from Demonstration with Implicit Nonlinear Dynamics Models

要約 デモンストレーション(LFD)から学ぶことは、ロボット操作で遭遇するような … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY, I.2 | Learning from Demonstration with Implicit Nonlinear Dynamics Models はコメントを受け付けていません

(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions

要約 合理性の概念は、人工知能の分野の中心です。 私たちが人間の推論をシミュレー … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG, cs.MA | (Ir)rationality in AI: State of the Art, Research Challenges and Open Questions はコメントを受け付けていません

pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning

要約 Federated Learning(FL)は、データがローカルのままであ … 続きを読む

カテゴリー: cs.AI, cs.LG | pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning はコメントを受け付けていません

DPO Meets PPO: Reinforced Token Optimization for RLHF

要約 人間のフィードバック(RLHF)フレームワークからの古典的な強化学習では、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | DPO Meets PPO: Reinforced Token Optimization for RLHF はコメントを受け付けていません

Large Continual Instruction Assistant

要約 継続的な指導チューニング(CIT)は、データによる人間の意図データに従うよ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Continual Instruction Assistant はコメントを受け付けていません

TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning

要約 実際のデータセットにおける騒々しいラベルの有病率は、深い学習モデルの効果的 … 続きを読む

カテゴリー: cs.AI, cs.LG | TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning はコメントを受け付けていません