「cs.CL」カテゴリーアーカイブ

SPEX: Scaling Feature Interaction Explanations for LLMs

投稿日: 2025年2月20日作成者: jarxiv

要約大規模な言語モデル（LLM）は、入力機能間の複雑な相互作用をキャプチャする … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IT, cs.LG, math.IT | コメントを受け付けていません

PSCon: Toward Conversational Product Search

投稿日: 2025年2月20日作成者: jarxiv

要約会話型製品検索（CPS）は、人間のような言語を反映する実際のCPSデータセ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

Multilingual Non-Factoid Question Answering with Answer Paragraph Selection

投稿日: 2025年2月20日作成者: jarxiv

要約ほとんどの既存の質問回答データセット（QUAD）は、主に高リソース言語のフ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

DataSciBench: An LLM Agent Benchmark for Data Science

投稿日: 2025年2月20日作成者: jarxiv

要約このホワイトペーパーでは、データサイエンスの大規模な言語モデル（LLM）機 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

How Do LLMs Perform Two-Hop Reasoning in Context?

投稿日: 2025年2月20日作成者: jarxiv

要約「ソクラテスは人間です。すべての人間は致命的です。したがって、ソクラテ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review

投稿日: 2025年2月20日作成者: jarxiv

要約推論能力は通常、数千億のパラメーターを備えた大規模な言語モデル（LLMS） … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

投稿日: 2025年2月20日作成者: jarxiv

要約トレーニングプロセス報酬モデル（PRMS）の現在のアプローチでは、事前定義 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region

投稿日: 2025年2月20日作成者: jarxiv

要約大規模な言語モデル（LLMS）の安全性の配置は脆弱なままです。なぜなら、そ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision

投稿日: 2025年2月20日作成者: jarxiv

要約検索された生成（RAG）は、知識集約型のタスクの大きな可能性を示しています … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

投稿日: 2025年2月20日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）における事実上の精度の評価は、急速 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

SPEX: Scaling Feature Interaction Explanations for LLMs

PSCon: Toward Conversational Product Search

Multilingual Non-Factoid Question Answering with Answer Paragraph Selection

DataSciBench: An LLM Agent Benchmark for Data Science

How Do LLMs Perform Two-Hop Reasoning in Context?

Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region

RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー