cs.LG」カテゴリーアーカイブ

Reinforcement Learning from Human Feedback without Reward Inference: Model-Free Algorithm and Instance-Dependent Analysis

要約 この論文では、一般的な軌道ごとの報酬モデルを使用したエピソード的なマルコフ … 続きを読む

カテゴリー: cs.LG, stat.ML | Reinforcement Learning from Human Feedback without Reward Inference: Model-Free Algorithm and Instance-Dependent Analysis はコメントを受け付けていません

A margin-based replacement for cross-entropy loss

要約 クロスエントロピー (CE) 損失は、ディープ ニューラル ネットワークを … 続きを読む

カテゴリー: cs.CV, cs.LG | A margin-based replacement for cross-entropy loss はコメントを受け付けていません

MyDigiTwin: A Privacy-Preserving Framework for Personalized Cardiovascular Risk Prediction and Scenario Exploration

要約 心血管疾患(CVD)は依然として主な死因であり、個別化された介入による一次 … 続きを読む

カテゴリー: cs.HC, cs.LG | MyDigiTwin: A Privacy-Preserving Framework for Personalized Cardiovascular Risk Prediction and Scenario Exploration はコメントを受け付けていません

Experience-replay Innovative Dynamics

要約 画期的な成功にもかかわらず、マルチエージェント強化学習 (MARL) は依 … 続きを読む

カテゴリー: cs.GT, cs.LG, cs.MA | Experience-replay Innovative Dynamics はコメントを受け付けていません

Score Combining for Contrastive OOD Detection

要約 分布外 (OOD) 検出では、テストサンプルが既知のインライア分布に由来す … 続きを読む

カテゴリー: cs.LG | Score Combining for Contrastive OOD Detection はコメントを受け付けていません

Quantitative Error Bounds for Scaling Limits of Stochastic Iterative Algorithms

要約 確率的勾配降下法 (SGD) や確率的勾配ランジュバン力学 (SGLD) … 続きを読む

カテゴリー: (Primary), 62-08, 62E17, 68T05, cs.LG, math.PR, math.ST, stat.ML, stat.TH | Quantitative Error Bounds for Scaling Limits of Stochastic Iterative Algorithms はコメントを受け付けていません

Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions

要約 時系列予測は、気象予測、ヘルスケア、構造健全性監視、予知保全、エネルギー … 続きを読む

カテゴリー: cs.LG | Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions はコメントを受け付けていません

CDW-CoT: Clustered Distance-Weighted Chain-of-Thoughts Reasoning

要約 大規模言語モデル (LLM) は最近、思考連鎖 (CoT) プロンプトを通 … 続きを読む

カテゴリー: cs.LG | CDW-CoT: Clustered Distance-Weighted Chain-of-Thoughts Reasoning はコメントを受け付けていません

Fast sparse optimization via adaptive shrinkage

要約 たとえば、大次元のデータ駆動型問題に対処したり、時間とともに変化するシステ … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Fast sparse optimization via adaptive shrinkage はコメントを受け付けていません

MoGERNN: An Inductive Traffic Predictor for Unobserved Locations in Dynamic Sensing Networks

要約 道路網が部分的に観測された場合、観測されていない場所の交通状態をどのように … 続きを読む

カテゴリー: cs.LG | MoGERNN: An Inductive Traffic Predictor for Unobserved Locations in Dynamic Sensing Networks はコメントを受け付けていません