「cs.LG」カテゴリーアーカイブ

Knowledge-Aware Parsimony Learning: A Perspective from Relational Graphs

投稿日: 2024年10月11日作成者: jarxiv

要約スケーリング則は、トレーニングデータセットと学習可能なパラメータの強引な … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Contrastive Learning Via Equivariant Representation

投稿日: 2024年10月11日作成者: jarxiv

要約不変対照学習 (ICL) 手法は、さまざまなドメインにわたって優れたパフォ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions

投稿日: 2024年10月11日作成者: jarxiv

要約フィードバックを提供することは、生徒のライティングスキルを向上させるため … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Reward-Augmented Data Enhances Direct Preference Alignment of LLMs

投稿日: 2024年10月11日作成者: jarxiv

要約大規模言語モデル (LLM) における好みの調整により、人間の指示や意図に … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Sparse Attention Decomposition Applied to Circuit Tracing

投稿日: 2024年10月11日作成者: jarxiv

要約多くの論文は、アテンションヘッドが互いに連携して複雑なタスクを実行すること … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

miniCodeProps: a Minimal Benchmark for Proving Code Properties

投稿日: 2024年10月11日作成者: jarxiv

要約 AI エージェントは、Lean などの証明アシスタントでの数学定理証明の自 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SE | コメントを受け付けていません

Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning

投稿日: 2024年10月11日作成者: jarxiv

要約パッキングは、最初は事前トレーニング段階で利用され、モデルの最大入力長に合 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Universal In-Context Approximation By Prompting Fully Recurrent Models

投稿日: 2024年10月11日作成者: jarxiv

要約ゼロショット学習とコンテキスト内学習により、モデルの微調整を行わずにタスク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Reference-based Metrics Disprove Themselves in Question Generation

投稿日: 2024年10月11日作成者: jarxiv

要約 BLEU や BERTScore などの参照ベースの指標は、質問生成 (Q … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Closer Look at Machine Unlearning for Large Language Models

投稿日: 2024年10月11日作成者: jarxiv

要約大規模言語モデル (LLM) は機密性の高いコンテンツや著作権で保護された … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Knowledge-Aware Parsimony Learning: A Perspective from Relational Graphs

Contrastive Learning Via Equivariant Representation

Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions

Reward-Augmented Data Enhances Direct Preference Alignment of LLMs

Sparse Attention Decomposition Applied to Circuit Tracing

miniCodeProps: a Minimal Benchmark for Proving Code Properties

Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning

Universal In-Context Approximation By Prompting Fully Recurrent Models

Reference-based Metrics Disprove Themselves in Question Generation

A Closer Look at Machine Unlearning for Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー