-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Optimal Quantization for Matrix Multiplication
要約 機械学習コミュニティの最近の研究では、大きな行列の非可逆圧縮 (量子化) … 続きを読む
Learning Graph Quantized Tokenizers for Transformers
要約 トランスフォーマーは、基礎モデルのバックボーン アーキテクチャとして機能し … 続きを読む
Data-Driven Estimation of Heterogeneous Treatment Effects
要約 治療がさまざまな個人にどのような影響を与えるかを推定することは、不均一な治 … 続きを読む
Many-Shot In-Context Learning
要約 大規模言語モデル (LLM) は、重みの更新を行わずに、推論時にコンテキス … 続きを読む
Artificial Kuramoto Oscillatory Neurons
要約 神経科学と AI の両方において、ニューロン間の「結合」が、ネットワークの … 続きを読む
Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach
要約 検索拡張生成 (RAG) は、大規模言語モデル (LLM) が長すぎるコン … 続きを読む
A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む
The Disparate Benefits of Deep Ensembles
要約 ディープ ニューラル ネットワークのアンサンブルであるディープ アンサンブ … 続きを読む
ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization
要約 報酬形成は強化学習 (RL) の重要な要素であり、特に報酬がまばらであると … 続きを読む
SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction
要約 大規模言語モデル (LLM) の最近の進歩により、長いコンテキストを処理で … 続きを読む