-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading
要約 リニアシステムのソリューションのクエリをエッジプロセッサに送信するエッジコ … 続きを読む
Doubly robust identification of treatment effects from multiple environments
要約 実用的および倫理的な制約では、多くの場合、特に医学と社会科学において、因果 … 続きを読む
EnQode: Fast Amplitude Embedding for Quantum Machine Learning Using Classical Data
要約 振幅埋め込み(AE)は、量子機械学習(QML)では、古典的なデータを量子回 … 続きを読む
Level Set Teleportation: An Optimization Perspective
要約 目標のレベルセットで勾配基準を最大化することにより、勾配降下(GD)を加速 … 続きを読む
An Effective Theory of Bias Amplification
要約 機械学習モデルは、データに存在するバイアスをキャプチャして増幅することがで … 続きを読む
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues
要約 Mamba、RWKV、GLA、MLSTM、Deltanetなどの線形再発性 … 続きを読む
The Problem of Coherence in Natural Language Explanations of Recommendations
要約 推奨事項に自然言語の説明を提供することは、非専門家ユーザーの観点から特に役 … 続きを読む
PENCIL: Long Thoughts with Short Memory
要約 最近の作品(O1、Deepseek R1など)は、言語モデルの推論能力を改 … 続きを読む
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond
要約 このペーパーでは、再現可能で費用対効果の高い方法論を使用して長い推論モデル … 続きを読む
DAPO: An Open-Source LLM Reinforcement Learning System at Scale
要約 推論スケーリングは、LLMSが前例のない推論能力を備えており、複雑な推論を … 続きを読む