-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
EuroLLM-9B: Technical Report
要約 このレポートは、24の公式欧州連合言語すべてと11の追加言語をカバーするこ … 続きを読む
AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment
要約 具体化されたエージェントの一部として、ユーザーからの自然言語の指示を考慮し … 続きを読む
Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning
要約 トレーニング強化学習(RL)エージェントには、多くの場合、重要な計算リソー … 続きを読む
TextAtari: 100K Frames Game Playing with Language Agents
要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む
Engagement-Driven Content Generation with Large Language Models
要約 大規模な言語モデル(LLMS)は、1対1の相互作用において重要な説得力のあ … 続きを読む
Balancing Profit and Fairness in Risk-Based Pricing Markets
要約 動的でリスクベースの価格設定は、健康保険や消費者クレジットなどの重要なリソ … 続きを読む
CLAIM: An Intent-Driven Multi-Agent Framework for Analyzing Manipulation in Courtroom Dialogues
要約 法廷は、命が決定され、運命が封印される場所であるが、操作は不浸透ではない。 … 続きを読む
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory
要約 最近、大規模な言語モデル(LLM)でのスケーリングテスト時間コンピューティ … 続きを読む
SLAC: Simulation-Pretrained Latent Action Space for Whole-Body Real-World RL
要約 有能な家庭用および産業ロボットを建設するには、モバイルマニピュレーターなど … 続きを読む
Horizon Reduction Makes RL Scalable
要約 この作業では、オフライン強化学習(RL)アルゴリズムのスケーラビリティを研 … 続きを読む