cs.AI」カテゴリーアーカイブ

Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs

要約 欧州連合の 24 の公用語すべてをサポートすることで、ヨーロッパの言語の多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs はコメントを受け付けていません

AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning

要約 この論文では、部分的に観察可能なオンライン強化学習用に設計されたトランスフ … 続きを読む

カテゴリー: cs.AI, cs.LG | AGaLiTe: Approximate Gated Linear Transformers for Online Reinforcement Learning はコメントを受け付けていません

Need of AI in Modern Education: in the Eyes of Explainable AI (xAI)

要約 現代教育は AI なしでは \textit{現代} ではありません。 ただ … 続きを読む

カテゴリー: cs.AI | Need of AI in Modern Education: in the Eyes of Explainable AI (xAI) はコメントを受け付けていません

Predicting from Strings: Language Model Embeddings for Bayesian Optimization

要約 ベイジアン最適化は、検索効率を向上させるための実験計画やブラックボックス最 … 続きを読む

カテゴリー: cs.AI, cs.LG | Predicting from Strings: Language Model Embeddings for Bayesian Optimization はコメントを受け付けていません

What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models

要約 言語モデル (LM) という用語は、対象となるモデルの時間固有のコレクショ … 続きを読む

カテゴリー: cs.AI, cs.CL | What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models はコメントを受け付けていません

LoRD: Adapting Differentiable Driving Policies to Distribution Shifts

要約 運用ドメイン間の分布の変化は、自動運転車 (SDV) の学習モデルのパフォ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | LoRD: Adapting Differentiable Driving Policies to Distribution Shifts はコメントを受け付けていません

Learning Smooth Humanoid Locomotion through Lipschitz-Constrained Policies

要約 強化学習とシミュレーションからリアルへの変換を組み合わせることで、脚式ロボ … 続きを読む

カテゴリー: cs.AI, cs.RO | Learning Smooth Humanoid Locomotion through Lipschitz-Constrained Policies はコメントを受け付けていません

Autonomous Improvement of Instruction Following Skills via Foundation Models

要約 自律的に収集された経験から改善できるインテリジェントな指示従うロボットには … 続きを読む

カテゴリー: cs.AI, cs.RO | Autonomous Improvement of Instruction Following Skills via Foundation Models はコメントを受け付けていません

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

要約 強化学習では、DDPG や TD3 などのオフポリシー アクタークリティカ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions はコメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoRA-Pro: Are Low-Rank Adapters Properly Optimized? はコメントを受け付けていません