-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Constructing Domain-Specific Evaluation Sets for LLM-as-a-judge
要約 大規模言語モデル (LLM) は機械学習の状況に革命をもたらしましたが、現 … 続きを読む
PEDAL: Enhancing Greedy Decoding with Large Language Models using Diverse Exemplars
要約 Self-Consistency などの多様な推論パスを備えた自己アンサン … 続きを読む
Deep Reinforcement Learning for Robotics: A Survey of Real-World Successes
要約 強化学習 (RL)、特にディープ RL (DRL) と呼ばれるディープ ニ … 続きを読む
FedRobo: Federated Learning Driven Autonomous Inter Robots Communication For Optimal Chemical Sprays
要約 フェデレーテッド ラーニングにより、ロボットは一元化されたデータ収集に依存 … 続きを読む
D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning
要約 オフライン強化学習アルゴリズムは、コストがかかる、または危険な現実世界の探 … 続きを読む
MMP++: Motion Manifold Primitives with Parametric Curve Models
要約 基本的なモーション スキルをエンコードするための多様体ベースのアプローチで … 続きを読む
AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights
要約 ナビゲーションの精度、速度、安定性は、安全な UAV 飛行操縦と動的な環境 … 続きを読む
S-RAF: A Simulation-Based Robustness Assessment Framework for Responsible Autonomous Driving
要約 人工知能 (AI) テクノロジーが進歩するにつれて、AI 駆動システムの堅 … 続きを読む
RBLA: Rank-Based-LoRA-Aggregation for Fine-tuning Heterogeneous Models in FLaaS
要約 Federated Learning (FL) は、携帯電話、デスクトップ … 続きを読む
Efficient Multi-Policy Evaluation for Reinforcement Learning
要約 複数のターゲット ポリシーを公平に評価するために、RL 実践者の間で主流の … 続きを読む
カテゴリー: cs.LG
Efficient Multi-Policy Evaluation for Reinforcement Learning はコメントを受け付けていません