cs.LG」カテゴリーアーカイブ

Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning

要約 安全な補強学習(RL)は、実際のアプリケーションにとって重要であり、マルチ … 続きを読む

カテゴリー: cs.AI, cs.LG | Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning はコメントを受け付けていません

Quantum-Enhanced Parameter-Efficient Learning for Typhoon Trajectory Forecasting

要約 台風の軌跡予測は災害の準備に不可欠ですが、大気のダイナミクスの複雑さと深い … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | Quantum-Enhanced Parameter-Efficient Learning for Typhoon Trajectory Forecasting はコメントを受け付けていません

PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment

要約 プロセス監督は、考え方の推論の各段階でフィードバックを提供することにより、 … 続きを読む

カテゴリー: cs.AI, cs.LG | PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment はコメントを受け付けていません

CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging

要約 マルチタスクモデルの合併は、複数のエキスパートモデルを追加のトレーニングな … 続きを読む

カテゴリー: cs.AI, cs.LG | CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging はコメントを受け付けていません

Rethinking Time Encoding via Learnable Transformation Functions

要約 時間情報を効果的にモデル化し、それを時系列に発生するイベントを含むアプリケ … 続きを読む

カテゴリー: cs.AI, cs.LG | Rethinking Time Encoding via Learnable Transformation Functions はコメントを受け付けていません

CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios

要約 大規模な言語モデル(LLMS)は、特に接触センターの運用において、カスタマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios はコメントを受け付けていません

Learning Autonomy: Off-Road Navigation Enhanced by Human Input

要約 自律運転のエリアでは、オフロード地形のナビゲートは、草や土などの予測不可能 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Learning Autonomy: Off-Road Navigation Enhanced by Human Input はコメントを受け付けていません

Quantum state-agnostic work extraction (almost) without dissipation

要約 未知の純粋なqubit状態の$ n $コピーへのシーケンシャルアクセスを使 … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | Quantum state-agnostic work extraction (almost) without dissipation はコメントを受け付けていません

Preserving Plasticity in Continual Learning with Adaptive Linearity Injection

要約 深いニューラルネットワークの可塑性の喪失は、モデルの段階的に学習する能力の … 続きを読む

カテゴリー: cs.AI, cs.LG | Preserving Plasticity in Continual Learning with Adaptive Linearity Injection はコメントを受け付けていません

\textsc{rfPG}: Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs

要約 不確実性の下での順次意思決定における部分的に観察可能なマルコフ決定プロセス … 続きを読む

カテゴリー: cs.AI, cs.LG | \textsc{rfPG}: Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs はコメントを受け付けていません