「cs.LG」カテゴリーアーカイブ

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

投稿日: 2025年2月12日作成者: jarxiv

要約数学的問題のための自動化された正式な証明生成で最先端の（SOTA）パフォー … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

A Unifying Framework for Causal Imitation Learning with Hidden Confounders

投稿日: 2025年2月12日作成者: jarxiv

要約文献からいくつかの既存の混乱したIL設定を包含する隠された交絡因子を使用し … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Programming Refusal with Conditional Activation Steering

投稿日: 2025年2月12日作成者: jarxiv

要約 LLMは顕著な能力を示していますが、反応行動を正確に制御することは依然とし … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Revisiting the Initial Steps in Adaptive Gradient Descent Optimization

投稿日: 2025年2月12日作成者: jarxiv

要約 Adamなどの適応勾配最適化方法は、より速い収束を達成する能力により、多様 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Learning from Demonstration with Implicit Nonlinear Dynamics Models

投稿日: 2025年2月12日作成者: jarxiv

要約デモンストレーション（LFD）から学ぶことは、ロボット操作で遭遇するような … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY, I.2 | コメントを受け付けていません

(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions

投稿日: 2025年2月12日作成者: jarxiv

要約合理性の概念は、人工知能の分野の中心です。私たちが人間の推論をシミュレー … 続きを読む →

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG, cs.MA | コメントを受け付けていません

pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning

投稿日: 2025年2月12日作成者: jarxiv

要約 Federated Learning（FL）は、データがローカルのままであ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

DPO Meets PPO: Reinforced Token Optimization for RLHF

投稿日: 2025年2月12日作成者: jarxiv

要約人間のフィードバック（RLHF）フレームワークからの古典的な強化学習では、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Large Continual Instruction Assistant

投稿日: 2025年2月12日作成者: jarxiv

要約継続的な指導チューニング（CIT）は、データによる人間の意図データに従うよ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning

投稿日: 2025年2月12日作成者: jarxiv

要約実際のデータセットにおける騒々しいラベルの有病率は、深い学習モデルの効果的 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

A Unifying Framework for Causal Imitation Learning with Hidden Confounders

Programming Refusal with Conditional Activation Steering

Revisiting the Initial Steps in Adaptive Gradient Descent Optimization

Learning from Demonstration with Implicit Nonlinear Dynamics Models

(Ir)rationality in AI: State of the Art, Research Challenges and Open Questions

pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning

DPO Meets PPO: Reinforced Token Optimization for RLHF

Large Continual Instruction Assistant

TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー