「cs.LG」カテゴリーアーカイブ

Reinforcement Learning from Human Feedback without Reward Inference: Model-Free Algorithm and Instance-Dependent Analysis

投稿日: 2025年1月22日作成者: jarxiv

要約この論文では、一般的な軌道ごとの報酬モデルを使用したエピソード的なマルコフ … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

A margin-based replacement for cross-entropy loss

投稿日: 2025年1月22日作成者: jarxiv

要約クロスエントロピー (CE) 損失は、ディープニューラルネットワークを … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MyDigiTwin: A Privacy-Preserving Framework for Personalized Cardiovascular Risk Prediction and Scenario Exploration

投稿日: 2025年1月22日作成者: jarxiv

要約心血管疾患（CVD）は依然として主な死因であり、個別化された介入による一次 … 続きを読む →

カテゴリー: cs.HC, cs.LG | コメントを受け付けていません

Experience-replay Innovative Dynamics

投稿日: 2025年1月22日作成者: jarxiv

要約画期的な成功にもかかわらず、マルチエージェント強化学習 (MARL) は依 … 続きを読む →

カテゴリー: cs.GT, cs.LG, cs.MA | コメントを受け付けていません

Score Combining for Contrastive OOD Detection

投稿日: 2025年1月22日作成者: jarxiv

要約分布外 (OOD) 検出では、テストサンプルが既知のインライア分布に由来す … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Quantitative Error Bounds for Scaling Limits of Stochastic Iterative Algorithms

投稿日: 2025年1月22日作成者: jarxiv

要約確率的勾配降下法 (SGD) や確率的勾配ランジュバン力学 (SGLD) … 続きを読む →

カテゴリー: (Primary), 62-08, 62E17, 68T05, cs.LG, math.PR, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions

投稿日: 2025年1月22日作成者: jarxiv

要約時系列予測は、気象予測、ヘルスケア、構造健全性監視、予知保全、エネルギー … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

CDW-CoT: Clustered Distance-Weighted Chain-of-Thoughts Reasoning

投稿日: 2025年1月22日作成者: jarxiv

要約大規模言語モデル (LLM) は最近、思考連鎖 (CoT) プロンプトを通 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Fast sparse optimization via adaptive shrinkage

投稿日: 2025年1月22日作成者: jarxiv

要約たとえば、大次元のデータ駆動型問題に対処したり、時間とともに変化するシステ … 続きを読む →

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | コメントを受け付けていません

MoGERNN: An Inductive Traffic Predictor for Unobserved Locations in Dynamic Sensing Networks

投稿日: 2025年1月22日作成者: jarxiv

要約道路網が部分的に観測された場合、観測されていない場所の交通状態をどのように … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Reinforcement Learning from Human Feedback without Reward Inference: Model-Free Algorithm and Instance-Dependent Analysis

A margin-based replacement for cross-entropy loss

MyDigiTwin: A Privacy-Preserving Framework for Personalized Cardiovascular Risk Prediction and Scenario Exploration

Experience-replay Innovative Dynamics

Score Combining for Contrastive OOD Detection

Quantitative Error Bounds for Scaling Limits of Stochastic Iterative Algorithms

Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions

CDW-CoT: Clustered Distance-Weighted Chain-of-Thoughts Reasoning

Fast sparse optimization via adaptive shrinkage

MoGERNN: An Inductive Traffic Predictor for Unobserved Locations in Dynamic Sensing Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー