cs.LG」カテゴリーアーカイブ

Multi-objective Good Arm Identification with Bandit Feedback

要約 マルチオブジェクトを備えた確率的盗賊設定での優れたアーム識別の問題を検討し … 続きを読む

カテゴリー: cs.LG | Multi-objective Good Arm Identification with Bandit Feedback はコメントを受け付けていません

Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves

要約 簡単な回避ゲームを演奏するディープラーニングエージェントによって表明された … 続きを読む

カテゴリー: cs.LG | Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves はコメントを受け付けていません

Tests for model misspecification in simulation-based inference: from local distortions to global model checks

要約 異常検出、モデル検証、モデルの比較などのモデル誤解分析戦略は、科学モデル開 … 続きを読む

カテゴリー: astro-ph.CO, astro-ph.IM, cs.LG, gr-qc | Tests for model misspecification in simulation-based inference: from local distortions to global model checks はコメントを受け付けていません

Make Optimization Once and for All with Fine-grained Guidance

要約 最適化(L2O)を学習することで、統合されたニューラルネットワークを使用し … 続きを読む

カテゴリー: 68Q32, cs.LG, I.2 | Make Optimization Once and for All with Fine-grained Guidance はコメントを受け付けていません

In Shift and In Variance: Assessing the Robustness of HAR Deep Learning Models against Variability

要約 ウェアラブル慣性測定ユニット(IMU)センサーを使用した人間の活動認識(H … 続きを読む

カテゴリー: cs.HC, cs.LG, eess.SP | In Shift and In Variance: Assessing the Robustness of HAR Deep Learning Models against Variability はコメントを受け付けていません

Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning

要約 Renforce Learning(RL)は、脚のロボットの安定した移動歩 … 続きを読む

カテゴリー: cs.LG, cs.RO | Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning はコメントを受け付けていません

A Real-World Energy Management Dataset from a Smart Company Building for Optimization and Machine Learning

要約 2018年から2023年までの6年間のスマート企業施設の監視から得られた大 … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY | A Real-World Energy Management Dataset from a Smart Company Building for Optimization and Machine Learning はコメントを受け付けていません

NeuMC — a package for neural sampling for lattice field theories

要約 \ pytorchに基づいた\ texttt {neumc}ソフトウェアパ … 続きを読む

カテゴリー: 68T07, cs.LG, hep-lat, J.2 | NeuMC — a package for neural sampling for lattice field theories はコメントを受け付けていません

A Review of DeepSeek Models’ Key Innovative Techniques

要約 DeepSeek-V3とDeepSeek-R1は、汎用タスクと推論のための … 続きを読む

カテゴリー: cs.LG | A Review of DeepSeek Models’ Key Innovative Techniques はコメントを受け付けていません

Reinforcement Learning with Verifiable Rewards: GRPO’s Effective Loss, Dynamics, and Success Amplification

要約 グループ相対ポリシー最適化(GRPO)が導入され、検証可能またはバイナリ報 … 続きを読む

カテゴリー: cs.LG, stat.ML | Reinforcement Learning with Verifiable Rewards: GRPO’s Effective Loss, Dynamics, and Success Amplification はコメントを受け付けていません