cs.LG」カテゴリーアーカイブ

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

要約 大規模な言語モデル(LLMS)は推論に優れていますが、トレーニング後の動作 … 続きを読む

カテゴリー: cs.CL, cs.LG | Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models はコメントを受け付けていません

AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI)

要約 LLMに対する敵対的な脅威は、現在の防御が適応できるよりも速くエスカレート … 続きを読む

カテゴリー: cs.CL, cs.LG | AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI) はコメントを受け付けていません

Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers

要約 前処理された言語モデル(LMS)は、算術エラーを発生しやすいです。 既存の … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.NE | Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers はコメントを受け付けていません

PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips

要約 モデルパラメーターのターゲットを絞ったビットワイズ腐敗を通じてジェイルブレ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | PrisonBreak: Jailbreaking Large Language Models with Fewer Than Twenty-Five Targeted Bit-flips はコメントを受け付けていません

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

要約 検証可能な報酬(RLVR)による強化学習は、数学的問題解決などの複雑な推論 … 続きを読む

カテゴリー: cs.CL, cs.LG | SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning はコメントを受け付けていません

e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs

要約 テスト時間スケーリングは、推論時により多くの計算を利用することにより、LL … 続きを読む

カテゴリー: cs.CL, cs.LG | e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs はコメントを受け付けていません

On The Impact of Merge Request Deviations on Code Review Practices

要約 コードレビューは、ソフトウェアエンジニアリングの重要な慣行であり、品質とコ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE | On The Impact of Merge Request Deviations on Code Review Practices はコメントを受け付けていません

SeerAttention-R: Sparse Attention Adaptation for Long Reasoning

要約 Seerattention-Rを紹介します。これは、推論モデルの長いデコー … 続きを読む

カテゴリー: cs.AI, cs.LG | SeerAttention-R: Sparse Attention Adaptation for Long Reasoning はコメントを受け付けていません

Intention-Conditioned Flow Occupancy Models

要約 大規模な事前トレーニングにより、機械学習の研究が今日どのように行われるかが … 続きを読む

カテゴリー: cs.AI, cs.LG | Intention-Conditioned Flow Occupancy Models はコメントを受け付けていません

PropMEND: Hypernetworks for Knowledge Propagation in LLMs

要約 大規模な言語モデル(LLMS)の知識編集手法は、後で再現可能な逐語的な知識 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PropMEND: Hypernetworks for Knowledge Propagation in LLMs はコメントを受け付けていません