cs.LG」カテゴリーアーカイブ

Non-Halting Queries: Exploiting Fixed Points in LLMs

要約 自己回帰モデルの固定点を悪用する新しい脆弱性を導入し、それを使用して停止し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Non-Halting Queries: Exploiting Fixed Points in LLMs はコメントを受け付けていません

Aligned at the Start: Conceptual Groupings in LLM Embeddings

要約 このペーパーでは、焦点を見越えられている入力埋め込み、つまりトランスブロッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Aligned at the Start: Conceptual Groupings in LLM Embeddings はコメントを受け付けていません

Score Change of Variables

要約 スコア関数の変数式の一般的な変更を導き出します。スムーズで反転可能な変換$ … 続きを読む

カテゴリー: 68T01, cs.AI, cs.LG, I.2.6, math.PR | Score Change of Variables はコメントを受け付けていません

Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models

要約 推論モデルへの関心の高まりにより、数学はアルゴリズムと方法論の改善の顕著な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models はコメントを受け付けていません

Learning to Reason at the Frontier of Learnability

要約 強化学習は現在、特に数学の問題などの推論スタイルのタスクについて、大規模な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Learning to Reason at the Frontier of Learnability はコメントを受け付けていません

The Empirical Impact of Reducing Symmetries on the Performance of Deep Ensembles and MoE

要約 最近の研究では、ニューラルネットワークの対称性を減らすことで、パラメーター … 続きを読む

カテゴリー: cs.AI, cs.LG | The Empirical Impact of Reducing Symmetries on the Performance of Deep Ensembles and MoE はコメントを受け付けていません

Large Language Models are Powerful EHR Encoders

要約 電子健康記録(EHR)は臨床的予測の豊富な可能性を提供しますが、それらの固 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Models are Powerful EHR Encoders はコメントを受け付けていません

Reasoning with Latent Thoughts: On the Power of Looped Transformers

要約 大規模な言語モデルは、顕著な推論能力を示しており、スケーリング法則は、特に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Reasoning with Latent Thoughts: On the Power of Looped Transformers はコメントを受け付けていません

The Geometry of Refusal in Large Language Models: Concept Cones and Representational Independence

要約 大規模な言語モデル(LLM)の安全性の配置は、敵対的に作られた入力を介して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Geometry of Refusal in Large Language Models: Concept Cones and Representational Independence はコメントを受け付けていません

LongSpec: Long-Context Speculative Decoding with Efficient Drafting and Verification

要約 投機的デコードは、大規模な言語モデル(LLMS)における自己回帰デコードの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LongSpec: Long-Context Speculative Decoding with Efficient Drafting and Verification はコメントを受け付けていません