-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Multi-objective Good Arm Identification with Bandit Feedback
要約 マルチオブジェクトを備えた確率的盗賊設定での優れたアーム識別の問題を検討し … 続きを読む
カテゴリー: cs.LG
Multi-objective Good Arm Identification with Bandit Feedback はコメントを受け付けていません
Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves
要約 簡単な回避ゲームを演奏するディープラーニングエージェントによって表明された … 続きを読む
カテゴリー: cs.LG
Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves はコメントを受け付けていません
Tests for model misspecification in simulation-based inference: from local distortions to global model checks
要約 異常検出、モデル検証、モデルの比較などのモデル誤解分析戦略は、科学モデル開 … 続きを読む
カテゴリー: astro-ph.CO, astro-ph.IM, cs.LG, gr-qc
Tests for model misspecification in simulation-based inference: from local distortions to global model checks はコメントを受け付けていません
Make Optimization Once and for All with Fine-grained Guidance
要約 最適化(L2O)を学習することで、統合されたニューラルネットワークを使用し … 続きを読む
In Shift and In Variance: Assessing the Robustness of HAR Deep Learning Models against Variability
要約 ウェアラブル慣性測定ユニット(IMU)センサーを使用した人間の活動認識(H … 続きを読む
Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning
要約 Renforce Learning(RL)は、脚のロボットの安定した移動歩 … 続きを読む
A Real-World Energy Management Dataset from a Smart Company Building for Optimization and Machine Learning
要約 2018年から2023年までの6年間のスマート企業施設の監視から得られた大 … 続きを読む
NeuMC — a package for neural sampling for lattice field theories
要約 \ pytorchに基づいた\ texttt {neumc}ソフトウェアパ … 続きを読む
A Review of DeepSeek Models’ Key Innovative Techniques
要約 DeepSeek-V3とDeepSeek-R1は、汎用タスクと推論のための … 続きを読む
カテゴリー: cs.LG
A Review of DeepSeek Models’ Key Innovative Techniques はコメントを受け付けていません
Reinforcement Learning with Verifiable Rewards: GRPO’s Effective Loss, Dynamics, and Success Amplification
要約 グループ相対ポリシー最適化(GRPO)が導入され、検証可能またはバイナリ報 … 続きを読む