cs.LG」カテゴリーアーカイブ

Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs

要約 欧州連合の 24 の公用語すべてをサポートすることで、ヨーロッパの言語の多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs はコメントを受け付けていません

AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning

要約 この論文では、部分的に観察可能なオンライン強化学習用に設計されたトランスフ … 続きを読む

カテゴリー: cs.AI, cs.LG | AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning はコメントを受け付けていません

Predicting from Strings: Language Model Embeddings for Bayesian Optimization

要約 ベイジアン最適化は、検索効率を向上させるための実験計画やブラックボックス最 … 続きを読む

カテゴリー: cs.AI, cs.LG | Predicting from Strings: Language Model Embeddings for Bayesian Optimization はコメントを受け付けていません

LoRD: Adapting Differentiable Driving Policies to Distribution Shifts

要約 運用ドメイン間の分布の変化は、自動運転車 (SDV) の学習モデルのパフォ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | LoRD: Adapting Differentiable Driving Policies to Distribution Shifts はコメントを受け付けていません

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

要約 強化学習では、DDPG や TD3 などのオフポリシー アクタークリティカ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions はコメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoRA-Pro: Are Low-Rank Adapters Properly Optimized? はコメントを受け付けていません

A Hitchhiker’s Guide to Scaling Law Estimation

要約 スケーリング則は、より少ないパラメーターまたはより小さなトレーニング セッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Hitchhiker’s Guide to Scaling Law Estimation はコメントを受け付けていません

Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection

要約 最先端の 3D オブジェクト検出器は、多くの場合、大量のラベル付きデータセ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection はコメントを受け付けていません

Learning Truncated Causal History Model for Video Restoration

要約 ビデオ復元に対する重要な課題の 1 つは、動きによって支配されるビデオ フ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learning Truncated Causal History Model for Video Restoration はコメントを受け付けていません

Latent Action Pretraining from Videos

要約 グランドトゥルースのロボットアクションラベルを使用せずに視覚言語アクション … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | Latent Action Pretraining from Videos はコメントを受け付けていません