「cs.LG」カテゴリーアーカイブ

Efficient Adversarial Training in LLMs with Continuous Attacks

投稿日: 2024年11月4日作成者: jarxiv

要約大規模言語モデル（LLM）は、その安全ガードレールを回避する敵対的攻撃に対 … 続きを読む →

カテゴリー: cs.CR, cs.LG | コメントを受け付けていません

Human-in-the-Loop Causal Discovery under Latent Confounding using Ancestral GFlowNets

投稿日: 2024年11月4日作成者: jarxiv

要約構造学習は因果推論の核心である。特に、潜在的な交絡因子を考慮する場合、専門 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Provable optimal transport with transformers: The essence of depth and prompt engineering

投稿日: 2024年11月4日作成者: jarxiv

要約変圧器の証明可能な性能保証を確立できるか？このような理論的保証を確立するこ … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Nyström Kernel Stein Discrepancy

投稿日: 2024年11月4日作成者: jarxiv

要約カーネル法はデータ科学や統計学で最も成功したアプローチの多くを支えており、 … 続きを読む →

カテゴリー: (Primary), cs.LG, G.3, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Scalable Training of Trustworthy and Energy-Efficient Predictive Graph Foundation Models for Atomistic Materials Modeling: A Case Study with HydraGNN

投稿日: 2024年11月4日作成者: jarxiv

要約 HydraGNNは、多頭のグラフ畳み込みニューラルネットワークアーキテクチ … 続きを読む →

カテゴリー: 68T07, 68T09, C.2.4, cs.LG, physics.comp-ph | コメントを受け付けていません

Highly Accurate Real-space Electron Densities with Neural Networks

投稿日: 2024年11月4日作成者: jarxiv

要約量子化学における変分法は、波動関数に直接アクセスできるという点で、他の手法 … 続きを読む →

カテゴリー: cs.LG, physics.chem-ph | コメントを受け付けていません

MoA: Mixture of Sparse Attention for Automatic Large Language Model Compression

投稿日: 2024年11月4日作成者: jarxiv

要約スパース注意は、長い文脈における大規模言語モデル（LLM）のメモリとスルー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

The Re-Label Method For Data-Centric Machine Learning

投稿日: 2024年11月4日作成者: jarxiv

要約ディープラーニングのアプリケーションでは、手作業でラベル付けされたデータに … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Parameter-Efficient Fine-Tuning in Large Models: A Survey of Methodologies

投稿日: 2024年11月4日作成者: jarxiv

要約生予測をスケーリングすることで予測される大規模モデルは、多くの分野で画期的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

In-Context Transfer Learning: Demonstration Synthesis by Transferring Similar Tasks

投稿日: 2024年11月4日作成者: jarxiv

要約インコンテキスト学習（In-Context Learning: ICL）は … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Efficient Adversarial Training in LLMs with Continuous Attacks

Human-in-the-Loop Causal Discovery under Latent Confounding using Ancestral GFlowNets

Provable optimal transport with transformers: The essence of depth and prompt engineering

Nyström Kernel Stein Discrepancy

Scalable Training of Trustworthy and Energy-Efficient Predictive Graph Foundation Models for Atomistic Materials Modeling: A Case Study with HydraGNN

Highly Accurate Real-space Electron Densities with Neural Networks

MoA: Mixture of Sparse Attention for Automatic Large Language Model Compression

The Re-Label Method For Data-Centric Machine Learning

Parameter-Efficient Fine-Tuning in Large Models: A Survey of Methodologies

In-Context Transfer Learning: Demonstration Synthesis by Transferring Similar Tasks

最近の投稿

最近のコメント

アーカイブ

カテゴリー