-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models
要約 大規模な言語モデル(LLMS)は推論に優れていますが、トレーニング後の動作 … 続きを読む
AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI)
要約 LLMに対する敵対的な脅威は、現在の防御が適応できるよりも速くエスカレート … 続きを読む
Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers
要約 前処理された言語モデル(LMS)は、算術エラーを発生しやすいです。 既存の … 続きを読む
PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips
要約 モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む
SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning
要約 検証可能な報酬(RLVR)による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む
e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs
要約 テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む
On The Impact of Merge Request Deviations on Code Review Practices
要約 コードレビューは、ソフトウェアエンジニアリングの重要な慣行であり、品質とコ … 続きを読む
SeerAttention-R: Sparse Attention Adaptation for Long Reasoning
要約 Seerattention-Rを紹介します。これは、推論モデルの長いデコー … 続きを読む
Intention-Conditioned Flow Occupancy Models
要約 大規模な事前トレーニングにより、機械学習の研究が今日どのように行われるかが … 続きを読む
PropMEND: Hypernetworks for Knowledge Propagation in LLMs
要約 大規模な言語モデル(LLMS)の知識編集手法は、後で再現可能な逐語的な知識 … 続きを読む