cs.AI」カテゴリーアーカイブ

A Survey Analyzing Generalization in Deep Reinforcement Learning

要約 強化学習の研究は、ディープ ニューラル ネットワークを利用して高次元の状態 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | A Survey Analyzing Generalization in Deep Reinforcement Learning はコメントを受け付けていません

Exploring Design Choices for Building Language-Specific LLMs

要約 大規模言語モデル (LLM) は急速に進歩しているにもかかわらず、大部分の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Exploring Design Choices for Building Language-Specific LLMs はコメントを受け付けていません

Aequitas Flow: Streamlining Fair ML Experimentation

要約 Aequitas Flow は、エンドツーエンドの公平な機械学習 (ML) … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG | Aequitas Flow: Streamlining Fair ML Experimentation はコメントを受け付けていません

ReasoningRec: Bridging Personalized Recommendations and Human-Interpretable Explanations through LLM Reasoning

要約 このペーパーでは、大規模言語モデル (LLM) を活用して推奨事項と人間が … 続きを読む

カテゴリー: cs.AI, cs.IR | ReasoningRec: Bridging Personalized Recommendations and Human-Interpretable Explanations through LLM Reasoning はコメントを受け付けていません

Certification for Differentially Private Prediction in Gradient-Based Training

要約 差分プライバシーは機械学習モデルの情報漏洩の上限ですが、意味のあるプライバ … 続きを読む

カテゴリー: cs.AI, cs.LG | Certification for Differentially Private Prediction in Gradient-Based Training はコメントを受け付けていません

Instigating Cooperation among LLM Agents Using Adaptive Information Modulation

要約 この論文では、人間の戦略的行動の代理として LLM エージェントを強化学習 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.GT | Instigating Cooperation among LLM Agents Using Adaptive Information Modulation はコメントを受け付けていません

Position Coupling: Improving Length Generalization of Arithmetic Transformers Using Task Structure

要約 整数の加算などの単純な算術タスクの場合でも、Transformer がトレ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Position Coupling: Improving Length Generalization of Arithmetic Transformers Using Task Structure はコメントを受け付けていません

Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks

要約 オフライン データセットで自己教師あり学習でトレーニングされた大規模モデル … 続きを読む

カテゴリー: cs.AI, cs.LG | Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks はコメントを受け付けていません

Grounding by Trying: LLMs with Reinforcement Learning-Enhanced Retrieval

要約 大規模言語モデル (LLM) の幻覚は、LLM が情報を検索し、実際の情報 … 続きを読む

カテゴリー: cs.AI, cs.LG | Grounding by Trying: LLMs with Reinforcement Learning-Enhanced Retrieval はコメントを受け付けていません

Bandits with Preference Feedback: A Stackelberg Game Perspective

要約 好みのフィードバックを備えたバンディットは、直接値のクエリではなくペアごと … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG, stat.ML | Bandits with Preference Feedback: A Stackelberg Game Perspective はコメントを受け付けていません