-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
LoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuning
要約 大規模な言語モデル(LLM)は、実際のアプリケーションで不可欠になっていま … 続きを読む
Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning
要約 多様な大手言語モデル(LLMS)の急速な出現により、ユーザークエリを最も適 … 続きを読む
The Compositional Architecture of Regret in Large Language Models
要約 大規模な言語モデルでの後悔とは、以前に生成された誤った情報と矛盾する証拠が … 続きを読む
J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization
要約 大規模な言語モデル(LLM)開発のペースの増加に対応するために、モデルの出 … 続きを読む
Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability
要約 Commongenなどの生成的なCommonsense推論タスクでは、生成 … 続きを読む
AutoRule: Reasoning Chain-of-thought Extracted Rule-based Rewards Improve Preference Learning
要約 ルールベースの報酬は、人間のフィードバック(RLHF)からの強化学習を改善 … 続きを読む
Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers
要約 私たちは、個人エージェントとして使用される大きな推論モデルの推論の痕跡でプ … 続きを読む
Dense SAE Latents Are Features, Not Bugs
要約 スパース自動エンコーダー(SAE)は、スパース性の制約を強制することにより … 続きを読む
Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence
要約 今日のAIエージェントはほとんどが沈黙しています – 彼らはオ … 続きを読む
Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models
要約 大規模な言語モデル(LLM)は、印象的な道徳的推論能力を示しています。 し … 続きを読む