cs.CL」カテゴリーアーカイブ

START: Self-taught Reasoner with Tools

要約 OpenAI-O1やDeepSeek-R1のような大きな推論モデル(LRM … 続きを読む

カテゴリー: cs.CL | START: Self-taught Reasoner with Tools はコメントを受け付けていません

SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing

要約 調査出版物の急速な成長を考えると、科学研究において調査論文は重要な役割を果 … 続きを読む

カテゴリー: cs.CL | SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing はコメントを受け付けていません

IFIR: A Comprehensive Benchmark for Evaluating Instruction-Following in Expert-Domain Information Retrieval

要約 Expert Domainsで命令に従う情報検索(IR)を評価するために設 … 続きを読む

カテゴリー: cs.CL, cs.IR | IFIR: A Comprehensive Benchmark for Evaluating Instruction-Following in Expert-Domain Information Retrieval はコメントを受け付けていません

Get my drift? Catching LLM Task Drift with Activation Deltas

要約 LLMは、外部ソースからのデータに基づいてユーザー命令を実行するために、検 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CY | Get my drift? Catching LLM Task Drift with Activation Deltas はコメントを受け付けていません

Diagnosing Moral Reasoning Acquisition in Language Models: Pragmatics and Generalization

要約 大規模な言語モデル(LLM)が、社会的価値を順守する応答だけであることを確 … 続きを読む

カテゴリー: cs.CL | Diagnosing Moral Reasoning Acquisition in Language Models: Pragmatics and Generalization はコメントを受け付けていません

An Information-theoretic Multi-task Representation Learning Framework for Natural Language Understanding

要約 このペーパーでは、すべてのタスクに対してノイズ不変の表現を抽出するための新 … 続きを読む

カテゴリー: cs.CL, cs.IT, cs.LG, math.IT | An Information-theoretic Multi-task Representation Learning Framework for Natural Language Understanding はコメントを受け付けていません

LLM-guided Plan and Retrieval: A Strategic Alignment for Interpretable User Satisfaction Estimation in Dialogue

要約 ユーザー満足度の推定(使用)として知られる会話システムに対するユーザーの満 … 続きを読む

カテゴリー: cs.CL | LLM-guided Plan and Retrieval: A Strategic Alignment for Interpretable User Satisfaction Estimation in Dialogue はコメントを受け付けていません

DIMSUM: Discourse in Mathematical Reasoning as a Supervision Module

要約 私たちは、小学校、数学の問題を提示する短いテキストのデータセットであるGS … 続きを読む

カテゴリー: cs.CL | DIMSUM: Discourse in Mathematical Reasoning as a Supervision Module はコメントを受け付けていません

Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases

要約 Deepseek-R1やOpenai-O3などの最新の推論強化ラージモデル … 続きを読む

カテゴリー: cs.CL | Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases はコメントを受け付けていません

UIPE: Enhancing LLM Unlearning by Removing Knowledge Related to Forgetting Targets

要約 大規模な言語モデル(LLM)は、大規模なデータセットでのトレーニング中に必 … 続きを読む

カテゴリー: cs.CL | UIPE: Enhancing LLM Unlearning by Removing Knowledge Related to Forgetting Targets はコメントを受け付けていません