cs.CL」カテゴリーアーカイブ

Reasoning Inconsistencies and How to Mitigate Them in Deep Learning

要約 近年のディープラーニングモデルと技術の進歩により、多様なタスクやモダリティ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | Reasoning Inconsistencies and How to Mitigate Them in Deep Learning はコメントを受け付けていません

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving

要約 問題解決のタスクは、コードベースを修正して、与えられた問題に対処するパッチ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving はコメントを受け付けていません

Agentic Large Language Models, a survey

要約 エージェント型LLM(エージェントとして動作する大規模な言語モデル)に大き … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Agentic Large Language Models, a survey はコメントを受け付けていません

Mixture of Attentions For Speculative Decoding

要約 大規模言語モデル(LLM)のパラメータ数の増加により、計算要件が大幅に急増 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Mixture of Attentions For Speculative Decoding はコメントを受け付けていません

Wormhole Memory: A Rubik’s Cube for Cross-Dialogue Retrieval

要約 本研究では、現在の大規模言語モデルにおけるダイアログ間のメモリ共有のギャッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Wormhole Memory: A Rubik’s Cube for Cross-Dialogue Retrieval はコメントを受け付けていません

Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models

要約 状態空間モデル(SSM)は、一貫したメモリ使用量と高いパフォーマンスにより … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models はコメントを受け付けていません

The Foundations of Tokenization: Statistical and Computational Concerns

要約 トークン化(アルファベットの文字列を語彙のトークン列に変換すること)は、自 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Foundations of Tokenization: Statistical and Computational Concerns はコメントを受け付けていません

Affordable AI Assistants with Knowledge Graph of Thoughts

要約 大規模言語モデル(Large Language Models: LLM)は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Affordable AI Assistants with Knowledge Graph of Thoughts はコメントを受け付けていません

A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models

要約 大規模な人工知能(AI)モデルは、標準化されたベンチマークにおいてその驚く … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models はコメントを受け付けていません

MegaMath: Pushing the Limits of Open Math Corpora

要約 数理的推論は人間の知能の基礎であり、大規模言語モデル(LLM)の高度な能力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MegaMath: Pushing the Limits of Open Math Corpora はコメントを受け付けていません