投稿者「jarxiv」のアーカイブ

Wait, We Don’t Need to ‘Wait’! Removing Thinking Tokens Improves Reasoning Efficiency

要約 大規模な推論モデルの最近の進歩により、複雑で段階的な推論が可能になりました … 続きを読む

カテゴリー: cs.CL | コメントする

Lessons from Training Grounded LLMs with Verifiable Rewards

要約 接地された信頼できる応答を生成することは、大規模な言語モデル(LLM)にと … 続きを読む

カテゴリー: cs.CL | コメントする

RATTENTION: Towards the Minimal Sliding Window Size in Local-Global Attention Models

要約 ローカルグローバルの注意モデルは最近、標準的な変圧器の説得力のある代替品と … 続きを読む

カテゴリー: cs.CL | コメントする

Approximating Language Model Training Data from Weights

要約 現代の言語モデルは、しばしばオープンウェイトを持っていますが、トレーニング … 続きを読む

カテゴリー: cs.CL | コメントする

How much do language models memorize?

要約 モデルがデータポイントについてどの程度知っているかを推定するための新しい方 … 続きを読む

カテゴリー: cs.CL | コメントする

PredGen: Accelerated Inference of Large Language Models through Input-Time Speculation for Real-Time Speech Interaction

要約 大規模な言語モデル(LLMS)は、通常、テキストツーチック(TTS)システ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | コメントする

Gender Inclusivity Fairness Index (GIFI): A Multilevel Framework for Evaluating Gender Diversity in Large Language Models

要約 大規模な言語モデル(LLMS)におけるジェンダー公平性の包括的な評価を提示 … 続きを読む

カテゴリー: cs.CL | コメントする

SciVer: Evaluating Foundation Models for Multimodal Scientific Claim Verification

要約 Sciverを紹介します。Sciverは、マルチモーダルの科学的コンテキス … 続きを読む

カテゴリー: cs.CL | コメントする

DiscoSG: Towards Discourse-Level Text Scene Graph Parsing through Iterative Graph Refinement

要約 Vision-Language Models(VLMS)は、談話レベルのマ … 続きを読む

カテゴリー: cs.CL | コメントする

Lean Workbook: A large-scale Lean problem set formalized from natural language math problems

要約 大規模な言語モデルは、特に数学的な問題を解決する際に、さまざまな自然言語処 … 続きを読む

カテゴリー: cs.CL | コメントする