投稿者「jarxiv」のアーカイブ

U-shaped and Inverted-U Scaling behind Emergent Abilities of Large Language Models

要約 大規模言語モデル (LLM) は、一部の下流タスクで新たな能力を発揮するこ … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows

要約 この論文は、香港の大学が ChatGPT を禁止していた時代と、ChatG … 続きを読む

カテゴリー: cs.AI, cs.CY | コメントする

CreDes: Causal Reasoning Enhancement and Dual-End Searching for Solving Long-Range Reasoning Problems using LLMs

要約 大規模言語モデル (LLM) では、因果的幻覚と巨大な検索空間が部分的に原 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Performant, Memory Efficient and Scalable Multi-Agent Reinforcement Learning

要約 マルチエージェント強化学習 (MARL) の分野がより大規模で複雑な環境に … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | コメントする

LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models

要約 ChatGPT や GPT-4 などの大規模言語モデル (LLM) の論理 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LO, cs.SE | コメントする

Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective

要約 高品質で特定のデータが不足しているため、合成データは大規模言語モデル (L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting

要約 バッチ プロンプトは、計算効率の向上を目的として、複数の入力を同時に処理す … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Evaluating Robustness of Reward Models for Mathematical Reasoning

要約 報酬モデルは、ヒューマン フィードバック (RLHF) システムからの強化 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Test Time Learning for Time Series Forecasting

要約 時系列予測は、マルチヘッド アテンションなどのトークン予測メカニズムの導入 … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Latent Diffusion Models for Controllable RNA Sequence Generation

要約 この研究では、可変長の個別の RNA 配列を生成および最適化するための潜在 … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.QM | コメントする