投稿者「jarxiv」のアーカイブ

High Accuracy, Less Talk (HALT): Reliable LLMs through Capability-Aligned Finetuning

要約 現在、大規模な言語モデル(LLMS)は、すべてのプロンプトに応答しています … 続きを読む

カテゴリー: cs.AI, cs.CL | High Accuracy, Less Talk (HALT): Reliable LLMs through Capability-Aligned Finetuning はコメントを受け付けていません

Revisiting Uncertainty Quantification Evaluation in Language Models: Spurious Interactions with Response Length Bias Results

要約 言語モデル(LMS)の不確実性の定量化(UQ)は、安全性と信頼性を改善する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Revisiting Uncertainty Quantification Evaluation in Language Models: Spurious Interactions with Response Length Bias Results はコメントを受け付けていません

AI and the Dynamic Supply of Training Data

要約 人工知能(AI)システムは、人間で生成されたデータに大きく依存していますが … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG, econ.GN, q-fin.EC | AI and the Dynamic Supply of Training Data はコメントを受け付けていません

REAL: Response Embedding-based Alignment for LLMs

要約 大規模な言語モデル(LLM)を人間の好みに合わせることは、通常、監視された … 続きを読む

カテゴリー: cs.AI, cs.CL | REAL: Response Embedding-based Alignment for LLMs はコメントを受け付けていません

LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation

要約 医学の大規模な言語モデル(LLM)を評価することは重要です。なぜなら、医療 … 続きを読む

カテゴリー: cs.AI, cs.CL | LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation はコメントを受け付けていません

EuroLLM-9B: Technical Report

要約 このレポートは、24の公式欧州連合言語すべてと11の追加言語をカバーするこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | EuroLLM-9B: Technical Report はコメントを受け付けていません

AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment

要約 具体化されたエージェントの一部として、ユーザーからの自然言語の指示を考慮し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment はコメントを受け付けていません

Zero-shot cross-modal transfer of Reinforcement Learning policies through a Global Workspace

要約 人間は複数の感覚を通して世界を知覚し、周囲の包括的な表現を作成し、ドメイン … 続きを読む

カテゴリー: cs.AI | Zero-shot cross-modal transfer of Reinforcement Learning policies through a Global Workspace はコメントを受け付けていません

Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning

要約 トレーニング強化学習(RL)エージェントには、多くの場合、重要な計算リソー … 続きを読む

カテゴリー: cs.AI, cs.LG | Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning はコメントを受け付けていません

TextAtari: 100K Frames Game Playing with Language Agents

要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TextAtari: 100K Frames Game Playing with Language Agents はコメントを受け付けていません