cs.LG」カテゴリーアーカイブ

Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data

要約 機械学習における現代のパラダイムには、さまざまなデータに対する事前トレーニ … 続きを読む

カテゴリー: cs.LG | Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data はコメントを受け付けていません

Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change

要約 反事実説明 (CFE) は、機械学習モデルへの入力を調整して目的の出力を達 … 続きを読む

カテゴリー: cs.AI, cs.LG | Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change はコメントを受け付けていません

The BrowserGym Ecosystem for Web Agent Research

要約 BrowserGym エコシステムは、Web エージェント、特に Web … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | The BrowserGym Ecosystem for Web Agent Research はコメントを受け付けていません

Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space

要約 最新の生成モデルは、トレーニング データの基礎となる抽象概念を識別して操作 … 続きを読む

カテゴリー: cs.AI, cs.LG | Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space はコメントを受け付けていません

Diffusion Policy Policy Optimization

要約 強化学習 (RL) からのポリシー勾配 (PG) 法を使用した連続制御タス … 続きを読む

カテゴリー: cs.LG, cs.RO | Diffusion Policy Policy Optimization はコメントを受け付けていません

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

要約 この論文では、独立したトークンごとのノイズ レベルで一連のトークンのノイズ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion はコメントを受け付けていません

Extrapolated Urban View Synthesis Benchmark

要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Extrapolated Urban View Synthesis Benchmark はコメントを受け付けていません

Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices

要約 構造健全性モニタリング (SHM) は、コンクリート橋脚の亀裂などのインフ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices はコメントを受け付けていません

Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulation for Time-Efficient Fine-Resolution Policy Learning

要約 土工や建設では、掘削機はさまざまな土壌条件が混在する大きな岩に遭遇すること … 続きを読む

カテゴリー: cs.LG, cs.RO | Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulation for Time-Efficient Fine-Resolution Policy Learning はコメントを受け付けていません

Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery

要約 模倣学習は、専門家の行動からポリシーを学習するデータ駆動型のアプローチです … 続きを読む

カテゴリー: cs.LG, cs.RO, stat.ML | Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery はコメントを受け付けていません