-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities
要約 強化学習(RL)は、推論モデルをトレーニングするための効果的な方法として浮 … 続きを読む
‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding
要約 Kolmogorov-Arnold Networks(KANS)は最近、従 … 続きを読む
FLAME-MoE: A Transparent End-to-End Research Platform for Mixture-of-Experts Language Models
要約 Gemini-1.5、Deepseek-V3、Llama-4などの最近の大 … 続きを読む
Preference-Based Gradient Estimation for ML-Guided Approximate Combinatorial Optimization
要約 組み合わせの最適化(CO)の問題は、医学、物流、製造などの幅広いドメインに … 続きを読む
Proxy-Free GFlowNet
要約 生成フローネットワーク(Gflownets)は、構成オブジェクト上の分布を … 続きを読む
Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts
要約 共変量シフトの下でのコンフォーマル予測の問題を考慮します。 ソースドメイン … 続きを読む
Uncertainty Quantification for LLM-Based Survey Simulations
要約 調査の質問に対する人間の反応をシミュレートし、信頼できる洞察を得るために不 … 続きを読む
Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks
要約 ニューラルネットワークをテンソレイズするには、その密な重量マトリックスの一 … 続きを読む
Outcome-based Reinforcement Learning to Predict the Future
要約 検証可能な報酬(RLVR)による強化学習は、大規模な言語モデルで数学とコー … 続きを読む
Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks
要約 予測コーディング(PC)は、ニューラルネットワークトレーニングのためのバッ … 続きを読む