-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data
要約 機械学習における現代のパラダイムには、さまざまなデータに対する事前トレーニ … 続きを読む
カテゴリー: cs.LG
Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data はコメントを受け付けていません
Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change
要約 反事実説明 (CFE) は、機械学習モデルへの入力を調整して目的の出力を達 … 続きを読む
The BrowserGym Ecosystem for Web Agent Research
要約 BrowserGym エコシステムは、Web エージェント、特に Web … 続きを読む
Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space
要約 最新の生成モデルは、トレーニング データの基礎となる抽象概念を識別して操作 … 続きを読む
Diffusion Policy Policy Optimization
要約 強化学習 (RL) からのポリシー勾配 (PG) 法を使用した連続制御タス … 続きを読む
Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
要約 この論文では、独立したトークンごとのノイズ レベルで一連のトークンのノイズ … 続きを読む
Extrapolated Urban View Synthesis Benchmark
要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む
Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices
要約 構造健全性モニタリング (SHM) は、コンクリート橋脚の亀裂などのインフ … 続きを読む
Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulation for Time-Efficient Fine-Resolution Policy Learning
要約 土工や建設では、掘削機はさまざまな土壌条件が混在する大きな岩に遭遇すること … 続きを読む
Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery
要約 模倣学習は、専門家の行動からポリシーを学習するデータ駆動型のアプローチです … 続きを読む