cs.CL」カテゴリーアーカイブ

LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning

要約 大規模な言語モデル(LLM)は、実際のアプリケーションで不可欠になっていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

要約 多様な大手言語モデル(LLMS)の急速な出現により、ユーザークエリを最も適 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

The Compositional Architecture of Regret in Large Language Models

要約 大規模な言語モデルでの後悔とは、以前に生成された誤った情報と矛盾する証拠が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

要約 大規模な言語モデル(LLM)開発のペースの増加に対応するために、モデルの出 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability

要約 Commongenなどの生成的なCommonsense推論タスクでは、生成 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning

要約 ルールベースの報酬は、人間のフィードバック(RLHF)からの強化学習を改善 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers

要約 私たちは、個人エージェントとして使用される大きな推論モデルの推論の痕跡でプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | コメントする

Dense SAE Latents Are Features, Not Bugs

要約 スパース自動エンコーダー(SAE)は、スパース性の制約を強制することにより … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence

要約 今日のAIエージェントはほとんどが沈黙しています – 彼らはオ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM, cs.RO | コメントする

Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models

要約 大規模な言語モデル(LLM)は、印象的な道徳的推論能力を示しています。 し … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする