「cs.CL」カテゴリーアーカイブ

LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデル（LLM）は、実際のアプリケーションで不可欠になっていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

投稿日: 2025年6月19日作成者: jarxiv

要約多様な大手言語モデル（LLMS）の急速な出現により、ユーザークエリを最も適 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The Compositional Architecture of Regret in Large Language Models

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデルでの後悔とは、以前に生成された誤った情報と矛盾する証拠が … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデル（LLM）開発のペースの増加に対応するために、モデルの出 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability

投稿日: 2025年6月19日作成者: jarxiv

要約 Commongenなどの生成的なCommonsense推論タスクでは、生成 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning

投稿日: 2025年6月19日作成者: jarxiv

要約ルールベースの報酬は、人間のフィードバック（RLHF）からの強化学習を改善 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers

投稿日: 2025年6月19日作成者: jarxiv

要約私たちは、個人エージェントとして使用される大きな推論モデルの推論の痕跡でプ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

Dense SAE Latents Are Features, Not Bugs

投稿日: 2025年6月19日作成者: jarxiv

要約スパース自動エンコーダー（SAE）は、スパース性の制約を強制することにより … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence

投稿日: 2025年6月19日作成者: jarxiv

要約今日のAIエージェントはほとんどが沈黙しています – 彼らはオ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM, cs.RO | コメントを受け付けていません

Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models

投稿日: 2025年6月19日作成者: jarxiv

要約大規模な言語モデル（LLM）は、印象的な道徳的推論能力を示しています。し … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning

Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

The Compositional Architecture of Regret in Large Language Models

J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization

Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability

AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning

Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers

Dense SAE Latents Are Features, Not Bugs

Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence

Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー