-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
A Lightweight Method to Disrupt Memorized Sequences in LLM
要約 言語モデルが拡大するにつれて、パフォーマンスは幅広いタスク全体で劇的に向上 … 続きを読む
ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition
要約 地域の方言の名前付きエンティティ認識(NER)は、特にバングラのような低リ … 続きを読む
Hardware-Efficient Attention for Fast Decoding
要約 LLMデコードは、大きなバッチと長いコンテキストのためにボトルネックされて … 続きを読む
Reinforcing General Reasoning without Verifiers
要約 最近のパラダイムは、検証可能な報酬に関するDeepSeek-R1-Zero … 続きを読む
Subgroups Matter for Robust Bias Mitigation
要約 機械学習のための新しいバイアス緩和方法の絶え間ない開発にもかかわらず、一貫 … 続きを読む
Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders
要約 多層パーセプロン(MLP)は大規模な言語モデルの不可欠な部分ですが、それら … 続きを読む
Improving LLM-based Global Optimization with Search Space Partitioning
要約 大規模な言語モデル(LLM)は最近、高価なブラックボックス関数のグローバル … 続きを読む
Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set
要約 $ Q $ -Learningは、最も基本的な強化学習アルゴリズムの1つで … 続きを読む
DeSocial: Blockchain-based Decentralized Social Networks
要約 Web 2.0ソーシャルプラットフォームは本質的に集中化されており、ユーザ … 続きを読む
Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features
要約 線形TD($ \ lambda $)は、ポリシー評価のための最も基本的な強 … 続きを読む