「cs.GT」カテゴリーアーカイブ

Learned Collusion

投稿日: 2025年5月29日作成者: jarxiv

要約 Qラーニングは、利用可能な各アクションに関連付けられた継続値の推定値（Q値 … 続きを読む →

カテゴリー: cs.AI, cs.GT, econ.TH | コメントを受け付けていません

Overcoming the Machine Penalty with Imperfectly Fair AI Agents

投稿日: 2025年5月29日作成者: jarxiv

要約急速な技術の進歩にもかかわらず、効果的な人間マシンの協力は依然として大きな … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.HC, econ.GN, q-fin.EC | コメントを受け付けていません

Strengthening Proportionality in Temporal Voting

投稿日: 2025年5月29日作成者: jarxiv

要約私たちは、承認投票で一時的な投票の枠組みの比例表現を研究しています。以前 … 続きを読む →

カテゴリー: cs.AI, cs.GT | コメントを受け付けていません

High-Dimensional Calibration from Swap Regret

投稿日: 2025年5月28日作成者: jarxiv

要約任意の凸セット$ \ mathcal {p} \ subset \ mat … 続きを読む →

カテゴリー: cs.DS, cs.GT, cs.LG, stat.ML | コメントを受け付けていません

A Framework for Adversarial Analysis of Decision Support Systems Prior to Deployment

投稿日: 2025年5月28日作成者: jarxiv

要約このペーパーでは、シミュレーションを通じて発見された学習行動パターンと脆弱 … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG | コメントを受け付けていません

The Limits of Preference Data for Post-Training

投稿日: 2025年5月27日作成者: jarxiv

要約大規模な言語モデルの能力を強化する最近の進歩は、自動的に検証可能な結果を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.GT, cs.LG | コメントを受け付けていません

On the Impact of the Utility in Semivalue-based Data Valuation

投稿日: 2025年5月26日作成者: jarxiv

要約 Semivalueベースのデータ評価は、協同ゲーム理論の直感を使用して、各 … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG | コメントを受け付けていません

Trustworthy Reputation Games and Applications to Proof-of-Reputation Blockchains

投稿日: 2025年5月21日作成者: jarxiv

要約評判システムは、ユーザーの行動に関するデータを収集して集約することにより、 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.GT | コメントを受け付けていません

Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources

投稿日: 2025年5月13日作成者: jarxiv

要約複数のソースにわたるデータの不均一性は、実際の機械学習（ML）設定で一般的 … 続きを読む →

カテゴリー: cs.GT, cs.LG | コメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

投稿日: 2025年5月12日作成者: jarxiv

要約非翻訳性を含むゼロサムゲームを解くために、有用なアプローチは、ナッシュ平衡 … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | コメントを受け付けていません

「cs.GT」カテゴリーアーカイブ

Learned Collusion

Overcoming the Machine Penalty with Imperfectly Fair AI Agents

Strengthening Proportionality in Temporal Voting

High-Dimensional Calibration from Swap Regret

A Framework for Adversarial Analysis of Decision Support Systems Prior to Deployment

The Limits of Preference Data for Post-Training

On the Impact of the Utility in Semivalue-based Data Valuation

Trustworthy Reputation Games and Applications to Proof-of-Reputation Blockchains

Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

最近の投稿

最近のコメント

アーカイブ

カテゴリー