-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
CompeteSMoE — Statistically Guaranteed Mixture of Experts Training via Competition
要約 エキスパートのまばらな混合物(SMOE)は、ネットワークの深さまたは幅を増 … 続きを読む
R3: Robust Rubric-Agnostic Reward Models
要約 報酬モデルは、言語モデルの出力を人間の好みに合わせるために不可欠ですが、既 … 続きを読む
IG Parser: A Software Package for the Encoding of Institutional Statements using the Institutional Grammar
要約 この記事では、Ig Parserの概要を説明します。これは、正式な(例:法 … 続きを読む
CoT-Kinetics: A Theoretical Modeling Assessing LRM Reasoning Process
要約 最近の大きな推論モデルは、推論を学ぶことにより、大規模な言語モデルの推論能 … 続きを読む
AdaptThink: Reasoning Models Can Learn When to Think
要約 最近、大規模な推論モデルは、人間のような深い思考を採用することにより、さま … 続きを読む
Optimizing Anytime Reasoning via Budget Relative Policy Optimization
要約 スケーリングテスト時間計算は、大規模な言語モデル(LLM)の推論機能を強化 … 続きを読む
Option-ID Based Elimination For Multiple Choice Questions
要約 複数選択の質問(MCQ)は、大規模な言語モデル(LLM)を評価するための一 … 続きを読む
Trust, But Verify: A Self-Verification Approach to Reinforcement Learning with Verifiable Rewards
要約 大規模な言語モデル(LLMS)は、複雑な推論に大きな約束を示しており、検証 … 続きを読む
CIE: Controlling Language Model Text Generations Using Continuous Signals
要約 ユーザーの意図で言語モデルを調整することは、ユーザーエクスペリエンスを向上 … 続きを読む