「cs.LG」カテゴリーアーカイブ

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な言語モデル（LLMS）は推論に優れていますが、トレーニング後の動作 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI)

投稿日: 2025年6月11日作成者: jarxiv

要約 LLMに対する敵対的な脅威は、現在の防御が適応できるよりも速くエスカレート … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers

投稿日: 2025年6月11日作成者: jarxiv

要約前処理された言語モデル（LMS）は、算術エラーを発生しやすいです。既存の … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.NE | コメントを受け付けていません

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

投稿日: 2025年6月11日作成者: jarxiv

要約モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

投稿日: 2025年6月11日作成者: jarxiv

要約テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

On The Impact of Merge Request Deviations on Code Review Practices

投稿日: 2025年6月11日作成者: jarxiv

要約コードレビューは、ソフトウェアエンジニアリングの重要な慣行であり、品質とコ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SE | コメントを受け付けていません

SeerAttention-R: Sparse Attention Adaptation for Long Reasoning

投稿日: 2025年6月11日作成者: jarxiv

要約 Seerattention-Rを紹介します。これは、推論モデルの長いデコー … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Intention-Conditioned Flow Occupancy Models

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な事前トレーニングにより、機械学習の研究が今日どのように行われるかが … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

PropMEND: Hypernetworks for Knowledge Propagation in LLMs

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な言語モデル（LLMS）の知識編集手法は、後で再現可能な逐語的な知識 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI)

Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

On The Impact of Merge Request Deviations on Code Review Practices

SeerAttention-R: Sparse Attention Adaptation for Long Reasoning

Intention-Conditioned Flow Occupancy Models

PropMEND: Hypernetworks for Knowledge Propagation in LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー