-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning
要約 安全な補強学習(RL)は、実際のアプリケーションにとって重要であり、マルチ … 続きを読む
Quantum-Enhanced Parameter-Efficient Learning for Typhoon Trajectory Forecasting
要約 台風の軌跡予測は災害の準備に不可欠ですが、大気のダイナミクスの複雑さと深い … 続きを読む
PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment
要約 プロセス監督は、考え方の推論の各段階でフィードバックを提供することにより、 … 続きを読む
CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging
要約 マルチタスクモデルの合併は、複数のエキスパートモデルを追加のトレーニングな … 続きを読む
Rethinking Time Encoding via Learnable Transformation Functions
要約 時間情報を効果的にモデル化し、それを時系列に発生するイベントを含むアプリケ … 続きを読む
CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios
要約 大規模な言語モデル(LLMS)は、特に接触センターの運用において、カスタマ … 続きを読む
Learning Autonomy: Off-Road Navigation Enhanced by Human Input
要約 自律運転のエリアでは、オフロード地形のナビゲートは、草や土などの予測不可能 … 続きを読む
Quantum state-agnostic work extraction (almost) without dissipation
要約 未知の純粋なqubit状態の$ n $コピーへのシーケンシャルアクセスを使 … 続きを読む
Preserving Plasticity in Continual Learning with Adaptive Linearity Injection
要約 深いニューラルネットワークの可塑性の喪失は、モデルの段階的に学習する能力の … 続きを読む
\textsc{rfPG}: Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs
要約 不確実性の下での順次意思決定における部分的に観察可能なマルコフ決定プロセス … 続きを読む