cs.AI」カテゴリーアーカイブ

Chumor 2.0: Towards Benchmarking Chinese Humor Understanding

要約 既存のユーモアのデータセットと評価は主に英語に焦点を当てており、中国語など … 続きを読む

カテゴリー: cs.AI, cs.CL | Chumor 2.0: Towards Benchmarking Chinese Humor Understanding はコメントを受け付けていません

DART-Math: Difficulty-Aware Rejection Tuning for Mathematical Problem-Solving

要約 数学的問題を解決するには高度な推論能力が必要であり、大規模な言語モデルには … 続きを読む

カテゴリー: cs.AI, cs.CL | DART-Math: Difficulty-Aware Rejection Tuning for Mathematical Problem-Solving はコメントを受け付けていません

Incentivized Symbiosis: A Paradigm for Human-Agent Coevolution

要約 私たちの生存と進歩には協力が不可欠です。 進化的ゲーム理論は、協力を戦略と … 続きを読む

カテゴリー: cs.AI, cs.MA | Incentivized Symbiosis: A Paradigm for Human-Agent Coevolution はコメントを受け付けていません

Generalized Neyman Allocation for Locally Minimax Optimal Best-Arm Identification

要約 この研究では、固定予算のベストアーム同定 (BAI) に対する漸近的局所ミ … 続きを読む

カテゴリー: cs.AI, cs.LG, econ.EM, stat.ME, stat.ML | Generalized Neyman Allocation for Locally Minimax Optimal Best-Arm Identification はコメントを受け付けていません

Fourier Position Embedding: Enhancing Attention’s Periodic Extension for Length Generalization

要約 Rotary Position Embedding (RoPE) を改善す … 続きを読む

カテゴリー: cs.AI, cs.CL | Fourier Position Embedding: Enhancing Attention’s Periodic Extension for Length Generalization はコメントを受け付けていません

RepoTransBench: A Real-World Benchmark for Repository-Level Code Translation

要約 リポジトリ レベルのコード変換とは、ソース リポジトリの機能を維持しながら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | RepoTransBench: A Real-World Benchmark for Repository-Level Code Translation はコメントを受け付けていません

Variational Sequential Optimal Experimental Design using Reinforcement Learning

要約 我々は、情報理論的基準を備えたベイジアンフレームワーク内で有限シーケンスの … 続きを読む

カテゴリー: 62C10, 62F15, 62K05, 62L05, 90C40, cs.AI, cs.LG, stat.CO, stat.ME, stat.ML | Variational Sequential Optimal Experimental Design using Reinforcement Learning はコメントを受け付けていません

Quantifying Positional Biases in Text Embedding Models

要約 埋め込みモデルは、情報検索 (IR) や意味的類似性の測定のタスクにとって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Quantifying Positional Biases in Text Embedding Models はコメントを受け付けていません

Deliberation in Latent Space via Differentiable Cache Augmentation

要約 中間の推論ステップを生成して処理することで大規模言語モデル (LLM) が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Deliberation in Latent Space via Differentiable Cache Augmentation はコメントを受け付けていません

In Case You Missed It: ARC ‘Challenge’ Is Not That Challenging

要約 ARC チャレンジは、現代の LLM にとって ARC Easy よりも難 … 続きを読む

カテゴリー: cs.AI, cs.CL | In Case You Missed It: ARC ‘Challenge’ Is Not That Challenging はコメントを受け付けていません