-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Cooperative Cruising: Reinforcement Learning based Time-Headway Control for Increased Traffic Efficiency
要約 コネクテッド自動運転車の普及は、運転効率を向上させ、交通渋滞を緩和する前例 … 続きを読む
Introduction to Reinforcement Learning
要約 人工知能(AI)の一分野である強化学習(RL)は、累積報酬を最大化するため … 続きを読む
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes
要約 平均報酬マルコフ決定過程(MDP)は、不確実性の下で逐次的な意思決定を行う … 続きを読む
TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning
要約 敵対的なシナリオで行動する自律エージェントは、時間的制約の中で特定の目的地 … 続きを読む
Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients
要約 オートエンコーダやシャムネットワークのような人工ニューラルネットワークが、 … 続きを読む
Filtered Direct Preference Optimization
要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む
CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs
要約 本稿では、小型言語モデル(SLM)と視覚言語モデル(VLM)の性能を分析し … 続きを読む
Medical Multimodal Foundation Models in Clinical Diagnosis and Treatment: Applications, Challenges, and Future Directions
要約 近年のディープラーニングの進歩は、臨床診断・治療の分野に大きな変革をもたら … 続きを読む
Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Environments with Delayed Rewards
要約 本稿では、強化学習(RL)における遅延報酬という難題に取り組む。プロキシマ … 続きを読む
From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs
要約 近年の大規模言語モデルの進歩により、そのコンテキストウィンドウは大幅に改善 … 続きを読む