投稿者「jarxiv」のアーカイブ

Wait, We Don’t Need to ‘Wait’! Removing Thinking Tokens Improves Reasoning Efficiency

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な推論モデルの最近の進歩により、複雑で段階的な推論が可能になりました … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Lessons from Training Grounded LLMs with Verifiable Rewards

投稿日: 2025年6月19日作成者: jarxiv

要約接地された信頼できる応答を生成することは、大規模な言語モデル（LLM）にと … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

RATTENTION: Towards the Minimal Sliding Window Size in Local-Global Attention Models

投稿日: 2025年6月19日作成者: jarxiv

要約ローカルグローバルの注意モデルは最近、標準的な変圧器の説得力のある代替品と … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Approximating Language Model Training Data from Weights

投稿日: 2025年6月19日作成者: jarxiv

要約現代の言語モデルは、しばしばオープンウェイトを持っていますが、トレーニング … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

How much do language models memorize?

投稿日: 2025年6月19日作成者: jarxiv

要約モデルがデータポイントについてどの程度知っているかを推定するための新しい方 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PredGen: Accelerated Inference of Large Language Models through Input-Time Speculation for Real-Time Speech Interaction

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、通常、テキストツーチック（TTS）システ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Gender Inclusivity Fairness Index (GIFI): A Multilevel Framework for Evaluating Gender Diversity in Large Language Models

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデル（LLMS）におけるジェンダー公平性の包括的な評価を提示 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

SciVer: Evaluating Foundation Models for Multimodal Scientific Claim Verification

投稿日: 2025年6月19日作成者: jarxiv

要約 Sciverを紹介します。Sciverは、マルチモーダルの科学的コンテキス … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DiscoSG: Towards Discourse-Level Text Scene Graph Parsing through Iterative Graph Refinement

投稿日: 2025年6月19日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、談話レベルのマ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Lean Workbook: A large-scale Lean problem set formalized from natural language math problems

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデルは、特に数学的な問題を解決する際に、さまざまな自然言語処 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Wait, We Don’t Need to ‘Wait’! Removing Thinking Tokens Improves Reasoning Efficiency

Lessons from Training Grounded LLMs with Verifiable Rewards

RATTENTION: Towards the Minimal Sliding Window Size in Local-Global Attention Models

Approximating Language Model Training Data from Weights

How much do language models memorize?

PredGen: Accelerated Inference of Large Language Models through Input-Time Speculation for Real-Time Speech Interaction

Gender Inclusivity Fairness Index (GIFI): A Multilevel Framework for Evaluating Gender Diversity in Large Language Models

SciVer: Evaluating Foundation Models for Multimodal Scientific Claim Verification

DiscoSG: Towards Discourse-Level Text Scene Graph Parsing through Iterative Graph Refinement

Lean Workbook: A large-scale Lean problem set formalized from natural language math problems

最近の投稿

最近のコメント

アーカイブ

カテゴリー