cs.CL」カテゴリーアーカイブ

Structured Thinking Matters: Improving LLMs Generalization in Causal Inference Tasks

要約 この分野での顕著な進歩にもかかわらず、LLMは因果関係を相関と区別する上で … 続きを読む

カテゴリー: cs.AI, cs.CL | Structured Thinking Matters: Improving LLMs Generalization in Causal Inference Tasks はコメントを受け付けていません

Compositional Causal Reasoning Evaluation in Language Models

要約 因果的推論と構成の推論は、AIの2つの中核となる願望です。 これらの動作の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Compositional Causal Reasoning Evaluation in Language Models はコメントを受け付けていません

Extended Inductive Reasoning for Personalized Preference Inference from Behavioral Signals

要約 大規模な言語モデル(LLMS)は、数学やコーディングなどの複雑な推論タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Extended Inductive Reasoning for Personalized Preference Inference from Behavioral Signals はコメントを受け付けていません

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

要約 大規模な言語モデル(LLM)は通常、データの混合物でトレーニングされていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Data Mixing Can Induce Phase Transitions in Knowledge Acquisition はコメントを受け付けていません

Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL

要約 大規模な言語モデル(LLM)は、質問の回答や対話などのタスクで優れています … 続きを読む

カテゴリー: cs.AI, cs.CL | Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL はコメントを受け付けていません

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

要約 インターネット上の大規模な言語モデル(LLM)ベンチマークを公開することは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ME | How Can I Publish My LLM Benchmark Without Giving the True Answers Away? はコメントを受け付けていません

ProgRM: Build Better GUI Agents with Progress Rewards

要約 LLMベースの(大手言語モデル)GUI(グラフィカルユーザーインターフェイ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ProgRM: Build Better GUI Agents with Progress Rewards はコメントを受け付けていません

Reward Model Overoptimisation in Iterated RLHF

要約 人間のフィードバック(RLHF)からの強化学習は、大規模な言語モデルを人間 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Reward Model Overoptimisation in Iterated RLHF はコメントを受け付けていません

Is Your Paper Being Reviewed by an LLM? Benchmarking AI Text Detection in Peer Review

要約 ピアレビューは、公開された科学研究の完全性を確保するための重要なプロセスで … 続きを読む

カテゴリー: cs.AI, cs.CL | Is Your Paper Being Reviewed by an LLM? Benchmarking AI Text Detection in Peer Review はコメントを受け付けていません

Gaming Tool Preferences in Agentic LLMs

要約 大規模な言語モデル(LLMS)は、モデルコンテキストプロトコル(MCP)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Gaming Tool Preferences in Agentic LLMs はコメントを受け付けていません