cs.CL」カテゴリーアーカイブ

SPEX: Scaling Feature Interaction Explanations for LLMs

要約 大規模な言語モデル(LLM)は、入力機能間の複雑な相互作用をキャプチャする … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IT, cs.LG, math.IT | SPEX: Scaling Feature Interaction Explanations for LLMs はコメントを受け付けていません

PSCon: Toward Conversational Product Search

要約 会話型製品検索(CPS)は、人間のような言語を反映する実際のCPSデータセ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | PSCon: Toward Conversational Product Search はコメントを受け付けていません

Multilingual Non-Factoid Question Answering with Answer Paragraph Selection

要約 ほとんどの既存の質問回答データセット(QUAD)は、主に高リソース言語のフ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Multilingual Non-Factoid Question Answering with Answer Paragraph Selection はコメントを受け付けていません

DataSciBench: An LLM Agent Benchmark for Data Science

要約 このホワイトペーパーでは、データサイエンスの大規模な言語モデル(LLM)機 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DataSciBench: An LLM Agent Benchmark for Data Science はコメントを受け付けていません

How Do LLMs Perform Two-Hop Reasoning in Context?

要約 「ソクラテスは人間です。 すべての人間は致命的です。 したがって、ソクラテ … 続きを読む

カテゴリー: cs.AI, cs.CL | How Do LLMs Perform Two-Hop Reasoning in Context? はコメントを受け付けていません

Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review

要約 推論能力は通常、数千億のパラメーターを備えた大規模な言語モデル(LLMS) … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review はコメントを受け付けていません

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

要約 トレーニングプロセス報酬モデル(PRMS)の現在のアプローチでは、事前定義 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence はコメントを受け付けていません

Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region

要約 大規模な言語モデル(LLMS)の安全性の配置は脆弱なままです。なぜなら、そ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Why Safeguarded Ships Run Aground? Aligned Large Language Models’ Safety Mechanisms Tend to Be Anchored in The Template Region はコメントを受け付けていません

RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision

要約 検索された生成(RAG)は、知識集約型のタスクの大きな可能性を示しています … 続きを読む

カテゴリー: cs.AI, cs.CL | RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision はコメントを受け付けていません

ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models

要約 大規模なビジョン言語モデル(LVLMS)における事実上の精度の評価は、急速 … 続きを読む

カテゴリー: cs.CL, cs.CV | ChineseSimpleVQA — ‘See the World, Discover Knowledge’: A Chinese Factuality Evaluation for Large Vision Language Models はコメントを受け付けていません