月別アーカイブ: 2024年6月

Extracting thin film structures of energy materials using transformers

要約 中性子反射率測定データ解析には、変圧器アーキテクチャを使用したニューラル … 続きを読む

カテゴリー: cs.AI, physics.comp-ph | Extracting thin film structures of energy materials using transformers はコメントを受け付けていません

Flow of Reasoning: Efficient Training of LLM Policy with Divergent Thinking

要約 発散的思考、つまり多様な解決策を生み出す認知プロセスは、人間の創造性と問題 … 続きを読む

カテゴリー: cs.AI, cs.CL | Flow of Reasoning: Efficient Training of LLM Policy with Divergent Thinking はコメントを受け付けていません

Bandits with Preference Feedback: A Stackelberg Game Perspective

要約 好みのフィードバックを備えたバンディットは、直接値のクエリではなくペアごと … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, stat.ML | Bandits with Preference Feedback: A Stackelberg Game Perspective はコメントを受け付けていません

Feature learning as alignment: a structural property of gradient descent in non-linear neural networks

要約 ニューラル ネットワークが特徴学習を通じて入力ラベルのペアから統計を抽出す … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Feature learning as alignment: a structural property of gradient descent in non-linear neural networks はコメントを受け付けていません

The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources

要約 基礎モデルの開発には、急速に拡大する貢献者、科学者、アプリケーションが集ま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources はコメントを受け付けていません

Addressing Polarization and Unfairness in Performative Prediction

要約 機械学習 (ML) モデルが人間が関与するアプリケーション (オンラインで … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG | Addressing Polarization and Unfairness in Performative Prediction はコメントを受け付けていません

Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots

要約 我々は、社会的に最適なプレイの順序、つまり、エージェントが自分の決定にコミ … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY, math.OC | Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots はコメントを受け付けていません

Pandora’s White-Box: Precise Training Data Detection and Extraction in Large Language Models

要約 この論文では、大規模言語モデル (LLM) に対する最先端のプライバシー攻 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Pandora’s White-Box: Precise Training Data Detection and Extraction in Large Language Models はコメントを受け付けていません

WARP: On the Benefits of Weight Averaged Rewarded Policies

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、人間の好みに基 … 続きを読む

カテゴリー: cs.AI, cs.LG | WARP: On the Benefits of Weight Averaged Rewarded Policies はコメントを受け付けていません

OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far?

要約 このレポートでは、次のような質問を投げかけます。OlympicArena … 続きを読む

カテゴリー: cs.AI, cs.CL | OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far? はコメントを受け付けていません