「cs.CL」カテゴリーアーカイブ

Reasoning Inconsistencies and How to Mitigate Them in Deep Learning

投稿日: 2025年4月4日作成者: jarxiv

要約近年のディープラーニングモデルと技術の進歩により、多様なタスクやモダリティ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | コメントを受け付けていません

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving

投稿日: 2025年4月4日作成者: jarxiv

要約問題解決のタスクは、コードベースを修正して、与えられた問題に対処するパッチ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

Agentic Large Language Models, a survey

投稿日: 2025年4月4日作成者: jarxiv

要約エージェント型LLM（エージェントとして動作する大規模な言語モデル）に大き … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Mixture of Attentions For Speculative Decoding

投稿日: 2025年4月4日作成者: jarxiv

要約大規模言語モデル(LLM)のパラメータ数の増加により、計算要件が大幅に急増 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Wormhole Memory: A Rubik’s Cube for Cross-Dialogue Retrieval

投稿日: 2025年4月4日作成者: jarxiv

要約本研究では、現在の大規模言語モデルにおけるダイアログ間のメモリ共有のギャッ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models

投稿日: 2025年4月4日作成者: jarxiv

要約状態空間モデル（SSM）は、一貫したメモリ使用量と高いパフォーマンスにより … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | コメントを受け付けていません

The Foundations of Tokenization: Statistical and Computational Concerns

投稿日: 2025年4月4日作成者: jarxiv

要約トークン化（アルファベットの文字列を語彙のトークン列に変換すること）は、自 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Affordable AI Assistants with Knowledge Graph of Thoughts

投稿日: 2025年4月4日作成者: jarxiv

要約大規模言語モデル（Large Language Models: LLM）は … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models

投稿日: 2025年4月4日作成者: jarxiv

要約大規模な人工知能（AI）モデルは、標準化されたベンチマークにおいてその驚く … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | コメントを受け付けていません

MegaMath: Pushing the Limits of Open Math Corpora

投稿日: 2025年4月4日作成者: jarxiv

要約数理的推論は人間の知能の基礎であり、大規模言語モデル（LLM）の高度な能力 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Reasoning Inconsistencies and How to Mitigate Them in Deep Learning

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving

Agentic Large Language Models, a survey

Mixture of Attentions For Speculative Decoding

Wormhole Memory: A Rubik’s Cube for Cross-Dialogue Retrieval

Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models

The Foundations of Tokenization: Statistical and Computational Concerns

Affordable AI Assistants with Knowledge Graph of Thoughts

A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models

MegaMath: Pushing the Limits of Open Math Corpora

最近の投稿

最近のコメント

アーカイブ

カテゴリー