「cs.LG」カテゴリーアーカイブ

Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs

投稿日: 2024年10月16日作成者: jarxiv

要約欧州連合の 24 の公用語すべてをサポートすることで、ヨーロッパの言語の多 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning

投稿日: 2024年10月16日作成者: jarxiv

要約この論文では、部分的に観察可能なオンライン強化学習用に設計されたトランスフ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Predicting from Strings: Language Model Embeddings for Bayesian Optimization

投稿日: 2024年10月16日作成者: jarxiv

要約ベイジアン最適化は、検索効率を向上させるための実験計画やブラックボックス最 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

LoRD: Adapting Differentiable Driving Policies to Distribution Shifts

投稿日: 2024年10月16日作成者: jarxiv

要約運用ドメイン間の分布の変化は、自動運転車 (SDV) の学習モデルのパフォ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

投稿日: 2024年10月16日作成者: jarxiv

要約強化学習では、DDPG や TD3 などのオフポリシーアクタークリティカ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | コメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

投稿日: 2024年10月16日作成者: jarxiv

要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Hitchhiker’s Guide to Scaling Law Estimation

投稿日: 2024年10月16日作成者: jarxiv

要約スケーリング則は、より少ないパラメーターまたはより小さなトレーニングセッ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection

投稿日: 2024年10月16日作成者: jarxiv

要約最先端の 3D オブジェクト検出器は、多くの場合、大量のラベル付きデータセ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Learning Truncated Causal History Model for Video Restoration

投稿日: 2024年10月16日作成者: jarxiv

要約ビデオ復元に対する重要な課題の 1 つは、動きによって支配されるビデオフ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Latent Action Pretraining from Videos

投稿日: 2024年10月16日作成者: jarxiv

要約グランドトゥルースのロボットアクションラベルを使用せずに視覚言語アクション … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs

AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning

Predicting from Strings: Language Model Embeddings for Bayesian Optimization

LoRD: Adapting Differentiable Driving Policies to Distribution Shifts

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

A Hitchhiker’s Guide to Scaling Law Estimation

Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection

Learning Truncated Causal History Model for Video Restoration

Latent Action Pretraining from Videos

最近の投稿

最近のコメント

アーカイブ

カテゴリー