cs.CL」カテゴリーアーカイブ

Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases

要約 Deepseek-R1やOpenai-O3などの推論強化大型言語モデル(L … 続きを読む

カテゴリー: cs.CL | Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases はコメントを受け付けていません

Folded Context Condensation in Path Integral Formalism for Infinite Context Transformers

要約 この作業では、パス積分形式のフレームワーク内でコアメカニズムを再解釈するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NE, hep-ph | Folded Context Condensation in Path Integral Formalism for Infinite Context Transformers はコメントを受け付けていません

Token-Supervised Value Models for Enhancing Mathematical Problem-Solving Capabilities of Large Language Models

要約 大規模な言語モデル(LLM)の数学的問題解決能力を改善するためのテスト時間 … 続きを読む

カテゴリー: cs.AI, cs.CL | Token-Supervised Value Models for Enhancing Mathematical Problem-Solving Capabilities of Large Language Models はコメントを受け付けていません

Language Models Fail to Introspect About Their Knowledge of Language

要約 大規模な言語モデル(LLM)が自分の内部状態について内省できるかどうかに最 … 続きを読む

カテゴリー: cs.AI, cs.CL | Language Models Fail to Introspect About Their Knowledge of Language はコメントを受け付けていません

TokenButler: Token Importance is Predictable

要約 大規模な言語モデル(LLMS)は、キー価値(kV)キャッシュに依存してトー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TokenButler: Token Importance is Predictable はコメントを受け付けていません

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

要約 大規模なマルチモーダルモデル(LMMS)の推論の強化は、特に建築的制約が推 … 続きを読む

カテゴリー: cs.AI, cs.CL | LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL はコメントを受け付けていません

KSOD: Knowledge Supplement for LLMs On Demand

要約 大規模な言語モデル(LLM)は、さまざまなタスクで顕著な機能を実証していま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | KSOD: Knowledge Supplement for LLMs On Demand はコメントを受け付けていません

MA-LoT: Multi-Agent Lean-based Long Chain-of-Thought Reasoning enhances Formal Theorem Proving

要約 LEANのようなコンピューターで検証可能な言語を使用して数学的問題を解決す … 続きを読む

カテゴリー: cs.AI, cs.CL | MA-LoT: Multi-Agent Lean-based Long Chain-of-Thought Reasoning enhances Formal Theorem Proving はコメントを受け付けていません

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

要約 テスト時間計算を効果的に使用するトレーニングモデルは、LLMSの推論パフォ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning はコメントを受け付けていません

Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation

要約 近年、ビジョン理解ドメインにおけるマルチモーダル大手言語モデル(MLLM) … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation はコメントを受け付けていません