-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
AutoL2S: Auto Long-Short Reasoning for Efficient Large Language Models
要約 推論対応の大規模な言語モデル(LLMS)は、複雑な推論タスクで強力なパフォ … 続きを読む
How Do LLMs Perform Two-Hop Reasoning in Context?
要約 「ソクラテスは人間です。 すべての人間は致命的です。 したがって、ソクラテ … 続きを読む
Human-Centered Human-AI Collaboration (HCHAC)
要約 インテリジェントな時代において、人間とインテリジェントシステムとの相互作用 … 続きを読む
Position: Don’t Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints
要約 有効なエラーバーや有意性テストを含む、大規模な言語モデル(LLM)の厳密な … 続きを読む
Learned Collusion
要約 Qラーニングは、利用可能な各アクションに関連付けられた継続値の推定値(Q値 … 続きを読む
On the Surprising Effectiveness of Large Learning Rates under Standard Width Scaling
要約 大規模なビジョンモデルと言語モデルをトレーニングするための主要なパラダイム … 続きを読む
Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation
要約 このホワイトペーパーでは、重要性サンプリングの行動ポリシーの推定に焦点を当 … 続きを読む
Novelty Detection in Reinforcement Learning with World Models
要約 世界モデルを使用した補強学習(RL)は、最近の大幅な成功を発見しています。 … 続きを読む
From Strangers to Assistants: Fast Desire Alignment for Embodied Agent-User Adaptation
要約 具体化されたエージェントは複雑な物理的タスクの実行に大きな進歩を遂げていま … 続きを読む