cs.LG」カテゴリーアーカイブ

A Unified Approach to Analysis and Design of Denoising Markov Models

要約 拡散モデルや流れベースのモデルなどの測定輸送に基づく確率的生成モデルは、多 … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML | A Unified Approach to Analysis and Design of Denoising Markov Models はコメントを受け付けていません

Linear Representations of Political Perspective Emerge in Large Language Models

要約 大規模な言語モデル(LLM)は、さまざまな主観的な人間の視点を現実的に反映 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | Linear Representations of Political Perspective Emerge in Large Language Models はコメントを受け付けていません

Medical Spoken Named Entity Recognition

要約 話された名前の名前のエンティティ認識(NER)は、スピーチから名前のエンテ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Medical Spoken Named Entity Recognition はコメントを受け付けていません

Representation Bending for Large Language Model Safety

要約 大規模な言語モデル(LLM)は強力なツールとして浮上していますが、有害なコ … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Representation Bending for Large Language Model Safety はコメントを受け付けていません

DEPT: Decoupled Embeddings for Pre-training Language Models

要約 言語モデルのプリトレーニングでは、幅広いデータ混合物を使用して、ドメインと … 続きを読む

カテゴリー: cs.CL, cs.LG | DEPT: Decoupled Embeddings for Pre-training Language Models はコメントを受け付けていません

Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure

要約 それらの印象的な能力にもかかわらず、LLMは逆転呪いとして知られる基本的な … 続きを読む

カテゴリー: cs.CL, cs.LG | Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure はコメントを受け付けていません

Interpretable Steering of Large Language Models with Feature Guided Activation Additions

要約 大規模な言語モデル(LLM)の動作に対する効果的かつ信頼できる制御は、重要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Interpretable Steering of Large Language Models with Feature Guided Activation Additions はコメントを受け付けていません

Hyper-Compression: Model Compression via Hyperfunction

要約 大規模なモデルのサイズの急速な成長は、コンピューティングリソースの成長をは … 続きを読む

カテゴリー: cs.AI, cs.ET, cs.LG | Hyper-Compression: Model Compression via Hyperfunction はコメントを受け付けていません

Rethinking Synthetic Data definitions: A privacy driven approach

要約 合成データは、AI開発のデータ需要の増加に対する費用対効果の高いソリューシ … 続きを読む

カテゴリー: cs.AI, cs.LG | Rethinking Synthetic Data definitions: A privacy driven approach はコメントを受け付けていません

Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis

要約 生成AIモデルは強力な機能を提供しますが、多くの場合透明性が欠けているため … 続きを読む

カテゴリー: cs.AI, cs.LG | Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis はコメントを受け付けていません