cs.LG」カテゴリーアーカイブ

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

要約 このホワイトペーパーでは、重要性サンプリングの行動ポリシーの推定に焦点を当 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation はコメントを受け付けていません

Novelty Detection in Reinforcement Learning with World Models

要約 世界モデルを使用した補強学習(RL)は、最近の大幅な成功を発見しています。 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY | Novelty Detection in Reinforcement Learning with World Models はコメントを受け付けていません

Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data

要約 詐欺の検出は、財務やeコマースなどのハイステークスドメインで重要なタスクの … 続きを読む

カテゴリー: cs.AI, cs.LG | Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data はコメントを受け付けていません

Training RL Agents for Multi-Objective Network Defense Tasks

要約 狭い能力よりも幅広い能力を達成するトレーニングエージェントを強調するオープ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Training RL Agents for Multi-Objective Network Defense Tasks はコメントを受け付けていません

TabularQGAN: A Quantum Generative Model for Tabular Data

要約 この論文では、表形式データを合成するための新しい量子生成モデルを紹介します … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | TabularQGAN: A Quantum Generative Model for Tabular Data はコメントを受け付けていません

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

要約 強化学習Finetuning(RFT)は、長い思考、自己修正、および効果的 … 続きを読む

カテゴリー: cs.AI, cs.LG | VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use はコメントを受け付けていません

Self-Error-Instruct: Generalizing from Errors for LLMs Mathematical Reasoning

要約 大規模な言語モデルは、さまざまなドメインで強力なパフォーマンスを示していま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Self-Error-Instruct: Generalizing from Errors for LLMs Mathematical Reasoning はコメントを受け付けていません

HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym

要約 近年、Openai Gymのようなツールを使用してRehnection L … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym はコメントを受け付けていません

On the performance of machine-learning assisted Monte Carlo in sampling from simple statistical physics models

要約 近年、従来の方法を使用して研究できないサンプルが困難なシステムのシミュレー … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG, physics.comp-ph | On the performance of machine-learning assisted Monte Carlo in sampling from simple statistical physics models はコメントを受け付けていません

Machine Unlearning under Overparameterization

要約 マシンの非学習アルゴリズムは、特定のトレーニングサンプルの影響を削除するこ … 続きを読む

カテゴリー: cs.AI, cs.LG | Machine Unlearning under Overparameterization はコメントを受け付けていません