「cs.LG」カテゴリーアーカイブ

Variance reduction combining pre-experiment and in-experiment data

投稿日: 2024年10月14日作成者: jarxiv

要約オンライン制御実験 (A/B テスト) は、多くの企業にとってデータ主導の … 続きを読む →

カテゴリー: cs.LG, econ.EM, stat.AP, stat.ME | コメントを受け付けていません

Linear Convergence of Diffusion Models Under the Manifold Hypothesis

投稿日: 2024年10月14日作成者: jarxiv

要約スコアマッチング生成モデルは、複雑な高次元データ分布からのサンプリングに成 … 続きを読む →

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Generative Verifiers: Reward Modeling as Next-Token Prediction

投稿日: 2024年10月14日作成者: jarxiv

要約検証者または報酬モデルは、大規模言語モデル (LLM) の推論パフォーマン … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Learn Your Reference Model for Real Good Alignment

投稿日: 2024年10月14日作成者: jarxiv

要約大規模言語モデル (LLM) の調整のためのオフラインメソッドは直接報酬 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization

投稿日: 2024年10月14日作成者: jarxiv

要約 Direct Preference Optimization (DPO) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Revisiting Hierarchical Text Classification: Inference and Metrics

投稿日: 2024年10月14日作成者: jarxiv

要約階層テキスト分類 (HTC) は、階層として編成された構造化スペース内のテ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Token Erasure as a Footprint of Implicit Vocabulary Items in LLMs

投稿日: 2024年10月14日作成者: jarxiv

要約 LLM はテキストを単語に大まかに対応するトークンのシーケンスとして処理し … 続きを読む →

カテゴリー: cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Science is Exploration: Computational Frontiers for Conceptual Metaphor Theory

投稿日: 2024年10月14日作成者: jarxiv

要約比喩はどこにでもあります。それらは、最も洗練された詩から一見無味乾燥な学 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Parameter-Efficient Fine-Tuning of State Space Models

投稿日: 2024年10月14日作成者: jarxiv

要約 Mamba (Gu & Dao、2024) などのディープステ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Evaluating Copyright Takedown Methods for Language Models

投稿日: 2024年10月14日作成者: jarxiv

要約言語モデル (LM) は、著作権で保護されている可能性のある素材を含む、多 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Variance reduction combining pre-experiment and in-experiment data

Linear Convergence of Diffusion Models Under the Manifold Hypothesis

Generative Verifiers: Reward Modeling as Next-Token Prediction

Learn Your Reference Model for Real Good Alignment

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization

Revisiting Hierarchical Text Classification: Inference and Metrics

Token Erasure as a Footprint of Implicit Vocabulary Items in LLMs

Science is Exploration: Computational Frontiers for Conceptual Metaphor Theory

Parameter-Efficient Fine-Tuning of State Space Models

Evaluating Copyright Takedown Methods for Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー