cs.CL」カテゴリーアーカイブ

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

要約 強化学習(RL)で訓練された推論モデル(例えば、Deepseek R1)は … 続きを読む

カテゴリー: cs.AI, cs.CL | ReTool: Reinforcement Learning for Strategic Tool Use in LLMs はコメントを受け付けていません

Retrieval-Augmented Generation with Conflicting Evidence

要約 大規模な言語モデル(LLM)エージェントは、回答の事実性を改善するために、 … 続きを読む

カテゴリー: cs.AI, cs.CL | Retrieval-Augmented Generation with Conflicting Evidence はコメントを受け付けていません

Citation-Enhanced Generation for LLM-based Chatbots

要約 大規模な言語モデル(LLMS)は、チャットボットへの統合を含む、多様なシナ … 続きを読む

カテゴリー: cs.AI, cs.CL | Citation-Enhanced Generation for LLM-based Chatbots はコメントを受け付けていません

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

要約 Sift(音声指導の微調整)、音声テキスト大規模言語モデル(LLM)の指示 … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning はコメントを受け付けていません

LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard

要約 このペーパーでは、大規模な言語モデル(LLM)の財務タスクへの適用を調査し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard はコメントを受け付けていません

FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents

要約 コミュニティの質問や回答から情報検索(IR)評価ベンチマークを自動的に構築 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents はコメントを受け付けていません

Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo

要約 幅広いLMアプリケーションでは、構文またはセマンティックの制約に準拠するテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo はコメントを受け付けていません

Antidistillation Sampling

要約 拡張された推論トレースを生成するフロンティアモデルは、モデルの蒸留を促進で … 続きを読む

カテゴリー: cs.AI, cs.CL | Antidistillation Sampling はコメントを受け付けていません

MIB: A Mechanistic Interpretability Benchmark

要約 新しい機械的解釈可能性の方法が実際の改善を達成するかどうかをどのように知る … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MIB: A Mechanistic Interpretability Benchmark はコメントを受け付けていません

Sleep-time Compute: Beyond Inference Scaling at Test-time

要約 スケーリングテスト時間計算は、大規模な言語モデル(LLM)を可能にするため … 続きを読む

カテゴリー: cs.AI, cs.CL | Sleep-time Compute: Beyond Inference Scaling at Test-time はコメントを受け付けていません