「cs.LG」カテゴリーアーカイブ

Beyond Autoregression: Fast LLMs via Self-Distillation Through Time

投稿日: 2024年10月29日作成者: jarxiv

要約自己回帰 (AR) 大規模言語モデル (LLM) は、多数のタスクにわたっ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MagicPIG: LSH Sampling for Efficient LLM Generation

投稿日: 2024年10月29日作成者: jarxiv

要約長いコンテキストウィンドウを持つ大規模言語モデル (LLM) が大きな注 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

CoBa: Convergence Balancer for Multitask Finetuning of Large Language Models

投稿日: 2024年10月29日作成者: jarxiv

要約マルチタスク学習 (MTL) は、タスク全体でパフォーマンスと汎化能力が向 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

End-To-End Causal Effect Estimation from Unstructured Natural Language Data

投稿日: 2024年10月29日作成者: jarxiv

要約介入の効果を知ることは人間の意思決定にとって重要ですが、因果関係の推定のた … 続きを読む →

カテゴリー: cs.CL, cs.LG, stat.ME | コメントを受け付けていません

Representation noising can prevent harmful fine-tuning on LLMs

投稿日: 2024年10月29日作成者: jarxiv

要約オープンソースの大規模言語モデル (LLM) をリリースすると、悪意のある … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

LoRA vs Full Fine-tuning: An Illusion of Equivalence

投稿日: 2024年10月29日作成者: jarxiv

要約微調整は、事前トレーニングされた大規模な言語モデルを下流のタスクに適応させ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

LongReward: Improving Long-context Large Language Models with AI Feedback

投稿日: 2024年10月29日作成者: jarxiv

要約ロングコンテキストのラージ言語モデル (LLM) の開発では大幅な進歩が達 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity

投稿日: 2024年10月29日作成者: jarxiv

要約セキュリティ記事やニュースなどのサイバー脅威インテリジェンス (CTI) … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG | コメントを受け付けていません

Learning to Handle Complex Constraints for Vehicle Routing Problems

投稿日: 2024年10月29日作成者: jarxiv

要約配車経路問題 (VRP) は、現実世界の多くのシナリオをモデル化でき、多く … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment

投稿日: 2024年10月29日作成者: jarxiv

要約計算タンパク質設計 (CPD) とは、タンパク質を設計するための計算手法の … 続きを読む →

カテゴリー: cs.AI, cs.LG, q-bio.BM | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Beyond Autoregression: Fast LLMs via Self-Distillation Through Time

MagicPIG: LSH Sampling for Efficient LLM Generation

CoBa: Convergence Balancer for Multitask Finetuning of Large Language Models

End-To-End Causal Effect Estimation from Unstructured Natural Language Data

Representation noising can prevent harmful fine-tuning on LLMs

LoRA vs Full Fine-tuning: An Illusion of Equivalence

LongReward: Improving Long-context Large Language Models with AI Feedback

CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity

Learning to Handle Complex Constraints for Vehicle Routing Problems

EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment

最近の投稿

最近のコメント

アーカイブ

カテゴリー