「cs.CL」カテゴリーアーカイブ

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

投稿日: 2025年4月18日作成者: jarxiv

要約強化学習（RL）で訓練された推論モデル（例えば、Deepseek R1）は … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Retrieval-Augmented Generation with Conflicting Evidence

投稿日: 2025年4月18日作成者: jarxiv

要約大規模な言語モデル（LLM）エージェントは、回答の事実性を改善するために、 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Citation-Enhanced Generation for LLM-based Chatbots

投稿日: 2025年4月18日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、チャットボットへの統合を含む、多様なシナ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

投稿日: 2025年4月18日作成者: jarxiv

要約 Sift（音声指導の微調整）、音声テキスト大規模言語モデル（LLM）の指示 … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard

投稿日: 2025年4月18日作成者: jarxiv

要約このペーパーでは、大規模な言語モデル（LLM）の財務タスクへの適用を調査し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents

投稿日: 2025年4月18日作成者: jarxiv

要約コミュニティの質問や回答から情報検索（IR）評価ベンチマークを自動的に構築 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo

投稿日: 2025年4月18日作成者: jarxiv

要約幅広いLMアプリケーションでは、構文またはセマンティックの制約に準拠するテ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Antidistillation Sampling

投稿日: 2025年4月18日作成者: jarxiv

要約拡張された推論トレースを生成するフロンティアモデルは、モデルの蒸留を促進で … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

MIB: A Mechanistic Interpretability Benchmark

投稿日: 2025年4月18日作成者: jarxiv

要約新しい機械的解釈可能性の方法が実際の改善を達成するかどうかをどのように知る … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Sleep-time Compute: Beyond Inference Scaling at Test-time

投稿日: 2025年4月18日作成者: jarxiv

要約スケーリングテスト時間計算は、大規模な言語モデル（LLM）を可能にするため … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Retrieval-Augmented Generation with Conflicting Evidence

Citation-Enhanced Generation for LLM-based Chatbots

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard

FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents

Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo

Antidistillation Sampling

MIB: A Mechanistic Interpretability Benchmark

Sleep-time Compute: Beyond Inference Scaling at Test-time

最近の投稿

最近のコメント

アーカイブ

カテゴリー