月別アーカイブ: 2024年1月

Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデルを人 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF はコメントを受け付けていません

Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

要約 Unbiased Learning to Rank (ULTR) は、ユー … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank はコメントを受け付けていません

FedFair^3: Unlocking Threefold Fairness in Federated Learning

要約 Federated Learning (FL) は、クライアントの生データ … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.DC, cs.LG | FedFair^3: Unlocking Threefold Fairness in Federated Learning はコメントを受け付けていません

Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization

要約 抽象的な要約における生成大規模言語モデル (LLM) の優れたパフォーマン … 続きを読む

カテゴリー: cs.AI, cs.CL | Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization はコメントを受け付けていません

TQCompressor: improving tensor decomposition methods in neural networks via permutations

要約 テンソル分解を改善したニューラル ネットワーク モデル圧縮の新しい方法であ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TQCompressor: improving tensor decomposition methods in neural networks via permutations はコメントを受け付けていません

Learning logic programs by discovering higher-order abstractions

要約 高次のリファクタリング問題を導入します。この問題の目的は、マップ、フィルタ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PL | Learning logic programs by discovering higher-order abstractions はコメントを受け付けていません

Zero-shot Imitation Policy via Search in Demonstration Dataset

要約 行動クローン作成では、デモンストレーションのデータセットを使用してポリシー … 続きを読む

カテゴリー: cs.AI | Zero-shot Imitation Policy via Search in Demonstration Dataset はコメントを受け付けていません

Scaling Sparse Fine-Tuning to Large Language Models

要約 大規模言語モデル (LLM) は、パラメーターの数が膨大であるため、完全に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Scaling Sparse Fine-Tuning to Large Language Models はコメントを受け付けていません

Learning to Manipulate under Limited Information

要約 社会的選択理論の古典的な結果によれば、合理的な優先投票方法は、個人に不誠実 … 続きを読む

カテゴリー: 68T07, 91B10, 91B12, 91B14, cs.AI, cs.GT, cs.LG, cs.MA, econ.TH, I.2.11 | Learning to Manipulate under Limited Information はコメントを受け付けていません

Evaluating explainability for machine learning predictions using model-agnostic metrics

要約 人工知能 (AI) テクノロジーの急速な進歩は、ガバナンスと規制の面で多く … 続きを読む

カテゴリー: cs.AI, cs.LG | Evaluating explainability for machine learning predictions using model-agnostic metrics はコメントを受け付けていません