「cs.LG」カテゴリーアーカイブ

A Unified Approach to Analysis and Design of Denoising Markov Models

投稿日: 2025年4月3日作成者: jarxiv

要約拡散モデルや流れベースのモデルなどの測定輸送に基づく確率的生成モデルは、多 … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML | コメントを受け付けていません

Linear Representations of Political Perspective Emerge in Large Language Models

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、さまざまな主観的な人間の視点を現実的に反映 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

Medical Spoken Named Entity Recognition

投稿日: 2025年4月3日作成者: jarxiv

要約話された名前の名前のエンティティ認識（NER）は、スピーチから名前のエンテ … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Representation Bending for Large Language Model Safety

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は強力なツールとして浮上していますが、有害なコ … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

DEPT: Decoupled Embeddings for Pre-training Language Models

投稿日: 2025年4月3日作成者: jarxiv

要約言語モデルのプリトレーニングでは、幅広いデータ混合物を使用して、ドメインと … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure

投稿日: 2025年4月3日作成者: jarxiv

要約それらの印象的な能力にもかかわらず、LLMは逆転呪いとして知られる基本的な … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Interpretable Steering of Large Language Models with Feature Guided Activation Additions

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な言語モデル（LLM）の動作に対する効果的かつ信頼できる制御は、重要 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Hyper-Compression: Model Compression via Hyperfunction

投稿日: 2025年4月3日作成者: jarxiv

要約大規模なモデルのサイズの急速な成長は、コンピューティングリソースの成長をは … 続きを読む →

カテゴリー: cs.AI, cs.ET, cs.LG | コメントを受け付けていません

Rethinking Synthetic Data definitions: A privacy driven approach

投稿日: 2025年4月3日作成者: jarxiv

要約合成データは、AI開発のデータ需要の増加に対する費用対効果の高いソリューシ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis

投稿日: 2025年4月3日作成者: jarxiv

要約生成AIモデルは強力な機能を提供しますが、多くの場合透明性が欠けているため … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

A Unified Approach to Analysis and Design of Denoising Markov Models

Linear Representations of Political Perspective Emerge in Large Language Models

Medical Spoken Named Entity Recognition

Representation Bending for Large Language Model Safety

DEPT: Decoupled Embeddings for Pre-training Language Models

Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure

Interpretable Steering of Large Language Models with Feature Guided Activation Additions

Hyper-Compression: Model Compression via Hyperfunction

Rethinking Synthetic Data definitions: A privacy driven approach

Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー