-
最近の投稿
- Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation
- Non-Determinism of ‘Deterministic’ LLM Settings
- Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service
- TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection
- Mr. DETR: Instructive Multi-Route Training for Detection Transformers
-
最近のコメント
表示できるコメントはありません。 cs.AI (35981) cs.CL (27219) cs.CR (2743) cs.CV (41828) cs.LG (40950) cs.RO (21217) cs.SY (3206) eess.IV (4914) eess.SY (3200) stat.ML (5368)
「stat.ML」カテゴリーアーカイブ
Fed-Joint: Joint Modeling of Nonlinear Degradation Signals and Failure Events for Remaining Useful Life Prediction using Federated Learning
要約 機械の多くの故障メカニズムは、条件監視(CM)信号の動作と密接に関連してい … 続きを読む
FlowKac: An Efficient Neural Fokker-Planck solver using Temporal Normalizing flows and the Feynman Kac-Formula
要約 高次元の複雑な動的システムのFokker-Planck方程式を解決すること … 続きを読む
Reinforcement Learning with Verifiable Rewards: GRPO’s Effective Loss, Dynamics, and Success Amplification
要約 グループ相対ポリシー最適化(GRPO)が導入され、検証可能またはバイナリ報 … 続きを読む
Non-asymptotic Analysis of Biased Adaptive Stochastic Approximation
要約 適応ステップを使用した確率勾配降下(SGD)は、深いニューラルネットワーク … 続きを読む
Early Directional Convergence in Deep Homogeneous Neural Networks for Small Initializations
要約 このホワイトペーパーでは、局所的にリプシッツグラデーションと2つ以上の均一 … 続きを読む
Vecchia Gaussian Process Ensembles on Internal Representations of Deep Neural Networks
要約 回帰タスクの場合、標準のガウスプロセス(GPS)は自然な不確実性の定量化( … 続きを読む
A transfer learning framework for weak-to-strong generalization
要約 最新の大規模な言語モデル(LLM)アラインメント手法は人間のフィードバック … 続きを読む
Power Spectrum Signatures of Graphs
要約 グラフ、ポイントクラウド、マニホールドのラプラシアン演算子に基づくポイント … 続きを読む
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model
要約 不確実性の定量化は、効率的な探索や安定したオフライン強化学習から、医療診断 … 続きを読む
Diverse Projection Ensembles for Distributional Reinforcement Learning
要約 古典的な強化学習(RL)とは対照的に、分布RLアルゴリズムは、期待値ではな … 続きを読む