「cs.LG」カテゴリーアーカイブ

Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning

投稿日: 2025年5月15日作成者: jarxiv

要約安全な補強学習（RL）は、実際のアプリケーションにとって重要であり、マルチ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Quantum-Enhanced Parameter-Efficient Learning for Typhoon Trajectory Forecasting

投稿日: 2025年5月15日作成者: jarxiv

要約台風の軌跡予測は災害の準備に不可欠ですが、大気のダイナミクスの複雑さと深い … 続きを読む →

カテゴリー: cs.AI, cs.LG, quant-ph | コメントを受け付けていません

PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment

投稿日: 2025年5月15日作成者: jarxiv

要約プロセス監督は、考え方の推論の各段階でフィードバックを提供することにより、 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging

投稿日: 2025年5月15日作成者: jarxiv

要約マルチタスクモデルの合併は、複数のエキスパートモデルを追加のトレーニングな … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Rethinking Time Encoding via Learnable Transformation Functions

投稿日: 2025年5月15日作成者: jarxiv

要約時間情報を効果的にモデル化し、それを時系列に発生するイベントを含むアプリケ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios

投稿日: 2025年5月15日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、特に接触センターの運用において、カスタマ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

Learning Autonomy: Off-Road Navigation Enhanced by Human Input

投稿日: 2025年5月15日作成者: jarxiv

要約自律運転のエリアでは、オフロード地形のナビゲートは、草や土などの予測不可能 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Quantum state-agnostic work extraction (almost) without dissipation

投稿日: 2025年5月15日作成者: jarxiv

要約未知の純粋なqubit状態の$ n $コピーへのシーケンシャルアクセスを使 … 続きを読む →

カテゴリー: cs.AI, cs.LG, quant-ph | コメントを受け付けていません

Preserving Plasticity in Continual Learning with Adaptive Linearity Injection

投稿日: 2025年5月15日作成者: jarxiv

要約深いニューラルネットワークの可塑性の喪失は、モデルの段階的に学習する能力の … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

\textsc{rfPG}: Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs

投稿日: 2025年5月15日作成者: jarxiv

要約不確実性の下での順次意思決定における部分的に観察可能なマルコフ決定プロセス … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning

Quantum-Enhanced Parameter-Efficient Learning for Typhoon Trajectory Forecasting

PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment

CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging

Rethinking Time Encoding via Learnable Transformation Functions

CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios

Learning Autonomy: Off-Road Navigation Enhanced by Human Input

Quantum state-agnostic work extraction (almost) without dissipation

Preserving Plasticity in Continual Learning with Adaptive Linearity Injection

\textsc{rfPG}: Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs

最近の投稿

最近のコメント

アーカイブ

カテゴリー