月別アーカイブ: 2025年2月

MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces

要約 オープンエンドの学習エージェントは、学習進捗(LP)を最大化するものに焦点 … 続きを読む

カテゴリー: cs.AI | MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces はコメントを受け付けていません

pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning

要約 Federated Learning(FL)は、データがローカルのままであ … 続きを読む

カテゴリー: cs.AI, cs.LG | pFedGPA: Diffusion-based Generative Parameter Aggregation for Personalized Federated Learning はコメントを受け付けていません

DPO Meets PPO: Reinforced Token Optimization for RLHF

要約 人間のフィードバック(RLHF)フレームワークからの古典的な強化学習では、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | DPO Meets PPO: Reinforced Token Optimization for RLHF はコメントを受け付けていません

Large Continual Instruction Assistant

要約 継続的な指導チューニング(CIT)は、データによる人間の意図データに従うよ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Continual Instruction Assistant はコメントを受け付けていません

TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning

要約 実際のデータセットにおける騒々しいラベルの有病率は、深い学習モデルの効果的 … 続きを読む

カテゴリー: cs.AI, cs.LG | TMLC-Net: Transferable Meta Label Correction for Noisy Label Learning はコメントを受け付けていません

Novelty Detection in Reinforcement Learning with World Models

要約 世界モデルを使用した補強学習(RL)は、最近の大幅な成功を発見しています。 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY | Novelty Detection in Reinforcement Learning with World Models はコメントを受け付けていません

Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art

要約 自律システムはすぐに、製造、農業、ヘルスケア、エンターテイメント、その他の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art はコメントを受け付けていません

Verifying LLM-Generated Code in the Context of Software Verification with Ada/SPARK

要約 大規模な言語モデル(LLM)は、顕著なコード生成機能を実証していますが、生 … 続きを読む

カテゴリー: cs.AI, cs.SE | Verifying LLM-Generated Code in the Context of Software Verification with Ada/SPARK はコメントを受け付けていません

TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks

要約 グラフニューラルネットワーク(GNNS)は、グラフドメインの対称性を保持す … 続きを読む

カテゴリー: cs.AI, cs.LG | TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks はコメントを受け付けていません

What makes math problems hard for reinforcement learning: a case study

要約 組み合わせグループ理論からの長年の推測を使用して、複数の観点から、不釣り合 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.CO, math.GR, math.GT | What makes math problems hard for reinforcement learning: a case study はコメントを受け付けていません