「cs.LG」カテゴリーアーカイブ

Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data

投稿日: 2024年12月12日作成者: jarxiv

要約機械学習における現代のパラダイムには、さまざまなデータに対する事前トレーニ … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change

投稿日: 2024年12月12日作成者: jarxiv

要約反事実説明 (CFE) は、機械学習モデルへの入力を調整して目的の出力を達 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

The BrowserGym Ecosystem for Web Agent Research

投稿日: 2024年12月12日作成者: jarxiv

要約 BrowserGym エコシステムは、Web エージェント、特に Web … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SE | コメントを受け付けていません

Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space

投稿日: 2024年12月12日作成者: jarxiv

要約最新の生成モデルは、トレーニングデータの基礎となる抽象概念を識別して操作 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Diffusion Policy Policy Optimization

投稿日: 2024年12月11日作成者: jarxiv

要約強化学習 (RL) からのポリシー勾配 (PG) 法を使用した連続制御タス … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

投稿日: 2024年12月11日作成者: jarxiv

要約この論文では、独立したトークンごとのノイズレベルで一連のトークンのノイズ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Extrapolated Urban View Synthesis Benchmark

投稿日: 2024年12月11日作成者: jarxiv

要約フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices

投稿日: 2024年12月11日作成者: jarxiv

要約構造健全性モニタリング (SHM) は、コンクリート橋脚の亀裂などのインフ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulation for Time-Efficient Fine-Resolution Policy Learning

投稿日: 2024年12月11日作成者: jarxiv

要約土工や建設では、掘削機はさまざまな土壌条件が混在する大きな岩に遭遇すること … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery

投稿日: 2024年12月11日作成者: jarxiv

要約模倣学習は、専門家の行動からポリシーを学習するデータ駆動型のアプローチです … 続きを読む →

カテゴリー: cs.LG, cs.RO, stat.ML | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Efficient Online Reinforcement Learning Fine-Tuning Need Not Retain Offline Data

Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change

The BrowserGym Ecosystem for Web Agent Research

Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space

Diffusion Policy Policy Optimization

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

Extrapolated Urban View Synthesis Benchmark

Crack-EdgeSAM Self-Prompting Crack Segmentation System for Edge Devices

Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulation for Time-Efficient Fine-Resolution Policy Learning

Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery

最近の投稿

最近のコメント

アーカイブ

カテゴリー