cs.LG」カテゴリーアーカイブ

Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning

要約 深層強化学習(RL)は、ハイパーパラメータに非常に敏感であることでよく知ら … 続きを読む

カテゴリー: cs.AI, cs.LG | Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning はコメントを受け付けていません

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

要約 強化学習法の大部分は、作用値関数の効果的な推定を得るために必要な計算量とデ … 続きを読む

カテゴリー: cs.AI, cs.LG | Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning はコメントを受け付けていません

MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses

要約 科学的発見は人類社会の繁栄に大きく貢献しており、最近の進歩は、LLMがこの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses はコメントを受け付けていません

AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings

要約 心電図(ECG)は、非侵襲的で安価な心臓モニタリングのツールであり、急性の … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.SP | AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings はコメントを受け付けていません

Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks

要約 オフラインのデータセットに対して自己教師付き学習で訓練された大規模モデルは … 続きを読む

カテゴリー: cs.AI, cs.LG | Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks はコメントを受け付けていません

Gumbel Counterfactual Generation From Language Models

要約 言語モデルにおける因果生成メカニズムを理解し操作することは、言語モデルの振 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Gumbel Counterfactual Generation From Language Models はコメントを受け付けていません

Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities?

要約 OpenAIのo1シリーズに代表される大規模言語モデル(LLM)におけるテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities? はコメントを受け付けていません

IOHunter: Graph Foundation Model to Uncover Online Information Operations

要約 ソーシャルメディア・プラットフォームは、現代の言論機関として、さまざまな声 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SI | IOHunter: Graph Foundation Model to Uncover Online Information Operations はコメントを受け付けていません

Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases

要約 機械学習(ML)アルゴリズムは、生物医学情報学における臨床的意思決定を支援 … 続きを読む

カテゴリー: cs.AI, cs.LG | Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases はコメントを受け付けていません

Error Bounds for Physics-Informed Neural Networks in Fokker-Planck PDEs

要約 確率微分方程式は確率過程の発展を記述するのに一般的に用いられる。このような … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NA, math.NA, physics.comp-ph | Error Bounds for Physics-Informed Neural Networks in Fokker-Planck PDEs はコメントを受け付けていません