-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Efficient Reasoning with Hidden Thinking
要約 チェーンオブテーブ(COT)の推論は、マルチモーダル大手言語モデル(MLL … 続きを読む
Can LLMs Separate Instructions From Data? And What Do We Even Mean By That?
要約 命令チューニングされた大手言語モデル(LLMS)は、多数の実用的なアプリケ … 続きを読む
mFollowIR: a Multilingual Benchmark for Instruction Following in Retrieval
要約 検索システムは一般に、短くて不足しているWebスタイルのクエリに焦点を当て … 続きを読む
Judge Decoding: Faster Speculative Sampling Requires Going Beyond Model Alignment
要約 大規模な言語モデル(LLMS)のパフォーマンスは、その基礎となるサイズに密 … 続きを読む
FlexiGPT: Pruning and Extending Large Language Models with Low-Rank Weight Sharing
要約 自然言語処理(NLP)における大規模な言語モデル(LLMS)の急速な増殖は … 続きを読む
GPT-4o as the Gold Standard: A Scalable and General Purpose Approach to Filter Language Model Pretraining Data
要約 大規模な言語モデルには膨大な量の高品質のトレーニングデータが必要ですが、W … 続きを読む
SELMA: A Speech-Enabled Language Model for Virtual Assistant Interactions
要約 この作業では、オーディオとテキストを大規模な言語モデル(LLM)に統合する … 続きを読む
Strassen Attention: Unlocking Compositional Abilities in Transformers Based on a New Lower Bound Method
要約 変圧器の理論的な制限を評価するための新しい方法を提案し、無限の精度で1層ソ … 続きを読む
Sparse Autoencoders Reveal Universal Feature Spaces Across Large Language Models
要約 私たちは、大規模な言語モデル(LLMS)の特徴普遍性を調査します。これは、 … 続きを読む
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence
要約 リスクに敏感な強化学習(RL)は、ハイステークスアプリケーションで信頼でき … 続きを読む