月別アーカイブ: 2025年3月

SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs

要約 トランスベースの大手言語モデル(LLM)はすでに長いテキストタスクで顕著な … 続きを読む

カテゴリー: cs.CL | SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs はコメントを受け付けていません

CodeReviewQA: The Code Review Comprehension Assessment for Large Language Models

要約 最先端の大規模な言語モデル(LLMS)は、印象的なコード生成機能を実証して … 続きを読む

カテゴリー: cs.CL, cs.SE | CodeReviewQA: The Code Review Comprehension Assessment for Large Language Models はコメントを受け付けていません

Binary-Integer-Programming Based Algorithm for Expert Load Balancing in Mixture-of-Experts Models

要約 MOE(Expertsの混合)モデルの事前トレーニングの場合、主な問題の1 … 続きを読む

カテゴリー: cs.CL, cs.LG | Binary-Integer-Programming Based Algorithm for Expert Load Balancing in Mixture-of-Experts Models はコメントを受け付けていません

Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-Distillation

要約 スケーリングアーキテクチャは、シーンテキスト認識(STR)の改善に効果的で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-Distillation はコメントを受け付けていません

Using Contextually Aligned Online Reviews to Measure LLMs’ Performance Disparities Across Language Varieties

要約 言語は異なる品種を持つことができます。 これらの品種は、大規模な言語モデル … 続きを読む

カテゴリー: cs.CL, cs.HC | Using Contextually Aligned Online Reviews to Measure LLMs’ Performance Disparities Across Language Varieties はコメントを受け付けていません

Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn’t

要約 大規模な言語モデル(LLM)の推論機能を強化することは、通常、大規模な計算 … 続きを読む

カテゴリー: cs.CL, cs.LG | Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn’t はコメントを受け付けていません

Graph-Guided Textual Explanation Generation Framework

要約 自然言語の説明(NLE)は、モデルの予測に関する推論のもっともらしい自由テ … 続きを読む

カテゴリー: cs.CL | Graph-Guided Textual Explanation Generation Framework はコメントを受け付けていません

Robust LLM safeguarding via refusal feature adversarial training

要約 大規模な言語モデル(LLM)は、有害な反応を引き出す可能性のある敵対的な攻 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Robust LLM safeguarding via refusal feature adversarial training はコメントを受け付けていません

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

要約 大きな言語モデルの推論は、さまざまなドメインで急速に進化しています。 ただ … 続きを読む

カテゴリー: cs.CL | Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning はコメントを受け付けていません

LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates

要約 最近の発見は、変圧器ベースの大手言語モデル(LLM)の知識の多くがそのフィ … 続きを読む

カテゴリー: cs.CL | LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates はコメントを受け付けていません