月別アーカイブ: 2024年1月

Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF

投稿日: 2024年1月30日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデルを人 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

投稿日: 2024年1月30日作成者: jarxiv

要約 Unbiased Learning to Rank (ULTR) は、ユー … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG | コメントを受け付けていません

FedFair^3: Unlocking Threefold Fairness in Federated Learning

投稿日: 2024年1月30日作成者: jarxiv

要約 Federated Learning (FL) は、クライアントの生データ … 続きを読む →

カテゴリー: cs.AI, cs.CY, cs.DC, cs.LG | コメントを受け付けていません

Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization

投稿日: 2024年1月30日作成者: jarxiv

要約抽象的な要約における生成大規模言語モデル (LLM) の優れたパフォーマン … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

TQCompressor: improving tensor decomposition methods in neural networks via permutations

投稿日: 2024年1月30日作成者: jarxiv

要約テンソル分解を改善したニューラルネットワークモデル圧縮の新しい方法であ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Learning logic programs by discovering higher-order abstractions

投稿日: 2024年1月30日作成者: jarxiv

要約高次のリファクタリング問題を導入します。この問題の目的は、マップ、フィルタ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.PL | コメントを受け付けていません

Zero-shot Imitation Policy via Search in Demonstration Dataset

投稿日: 2024年1月30日作成者: jarxiv

要約行動クローン作成では、デモンストレーションのデータセットを使用してポリシー … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Scaling Sparse Fine-Tuning to Large Language Models

投稿日: 2024年1月30日作成者: jarxiv

要約大規模言語モデル (LLM) は、パラメーターの数が膨大であるため、完全に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Learning to Manipulate under Limited Information

投稿日: 2024年1月30日作成者: jarxiv

要約社会的選択理論の古典的な結果によれば、合理的な優先投票方法は、個人に不誠実 … 続きを読む →

カテゴリー: 68T07, 91B10, 91B12, 91B14, cs.AI, cs.GT, cs.LG, cs.MA, econ.TH, I.2.11 | コメントを受け付けていません

Evaluating explainability for machine learning predictions using model-agnostic metrics

投稿日: 2024年1月30日作成者: jarxiv

要約人工知能 (AI) テクノロジーの急速な進歩は、ガバナンスと規制の面で多く … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年1月

Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF

Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

FedFair^3: Unlocking Threefold Fairness in Federated Learning

Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization

TQCompressor: improving tensor decomposition methods in neural networks via permutations

Learning logic programs by discovering higher-order abstractions

Zero-shot Imitation Policy via Search in Demonstration Dataset

Scaling Sparse Fine-Tuning to Large Language Models

Learning to Manipulate under Limited Information

Evaluating explainability for machine learning predictions using model-agnostic metrics

最近の投稿

最近のコメント

アーカイブ

カテゴリー