cs.CL」カテゴリーアーカイブ

LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning

要約 大規模な言語モデル(LLM)は、実際のアプリケーションで不可欠になっていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning はコメントを受け付けていません

Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

要約 多様な大手言語モデル(LLMS)の急速な出現により、ユーザークエリを最も適 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning はコメントを受け付けていません

The Compositional Architecture of Regret in Large Language Models

要約 大規模な言語モデルでの後悔とは、以前に生成された誤った情報と矛盾する証拠が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Compositional Architecture of Regret in Large Language Models はコメントを受け付けていません

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

要約 大規模な言語モデル(LLM)開発のペースの増加に対応するために、モデルの出 … 続きを読む

カテゴリー: cs.AI, cs.CL | J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization はコメントを受け付けていません

Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability

要約 Commongenなどの生成的なCommonsense推論タスクでは、生成 … 続きを読む

カテゴリー: cs.AI, cs.CL | Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability はコメントを受け付けていません

AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning

要約 ルールベースの報酬は、人間のフィードバック(RLHF)からの強化学習を改善 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning はコメントを受け付けていません

Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers

要約 私たちは、個人エージェントとして使用される大きな推論モデルの推論の痕跡でプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers はコメントを受け付けていません

Dense SAE Latents Are Features, Not Bugs

要約 スパース自動エンコーダー(SAE)は、スパース性の制約を強制することにより … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Dense SAE Latents Are Features, Not Bugs はコメントを受け付けていません

Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence

要約 今日のAIエージェントはほとんどが沈黙しています – 彼らはオ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM, cs.RO | Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence はコメントを受け付けていません

Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models

要約 大規模な言語モデル(LLM)は、印象的な道徳的推論能力を示しています。 し … 続きを読む

カテゴリー: cs.AI, cs.CL | Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models はコメントを受け付けていません