cs.LG」カテゴリーアーカイブ

Beyond Autoregression: Fast LLMs via Self-Distillation Through Time

要約 自己回帰 (AR) 大規模言語モデル (LLM) は、多数のタスクにわたっ … 続きを読む

カテゴリー: cs.CL, cs.LG | Beyond Autoregression: Fast LLMs via Self-Distillation Through Time はコメントを受け付けていません

MagicPIG: LSH Sampling for Efficient LLM Generation

要約 長いコンテキスト ウィンドウを持つ大規模言語モデル (LLM) が大きな注 … 続きを読む

カテゴリー: cs.CL, cs.LG | MagicPIG: LSH Sampling for Efficient LLM Generation はコメントを受け付けていません

CoBa: Convergence Balancer for Multitask Finetuning of Large Language Models

要約 マルチタスク学習 (MTL) は、タスク全体でパフォーマンスと汎化能力が向 … 続きを読む

カテゴリー: cs.CL, cs.LG | CoBa: Convergence Balancer for Multitask Finetuning of Large Language Models はコメントを受け付けていません

End-To-End Causal Effect Estimation from Unstructured Natural Language Data

要約 介入の効果を知ることは人間の意思決定にとって重要ですが、因果関係の推定のた … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ME | End-To-End Causal Effect Estimation from Unstructured Natural Language Data はコメントを受け付けていません

Representation noising can prevent harmful fine-tuning on LLMs

要約 オープンソースの大規模言語モデル (LLM) をリリースすると、悪意のある … 続きを読む

カテゴリー: cs.CL, cs.LG | Representation noising can prevent harmful fine-tuning on LLMs はコメントを受け付けていません

LoRA vs Full Fine-tuning: An Illusion of Equivalence

要約 微調整は、事前トレーニングされた大規模な言語モデルを下流のタスクに適応させ … 続きを読む

カテゴリー: cs.CL, cs.LG | LoRA vs Full Fine-tuning: An Illusion of Equivalence はコメントを受け付けていません

LongReward: Improving Long-context Large Language Models with AI Feedback

要約 ロングコンテキストのラージ言語モデル (LLM) の開発では大幅な進歩が達 … 続きを読む

カテゴリー: cs.CL, cs.LG | LongReward: Improving Long-context Large Language Models with AI Feedback はコメントを受け付けていません

CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity

要約 セキュリティ記事やニュースなどのサイバー脅威インテリジェンス (CTI) … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity はコメントを受け付けていません

Learning to Handle Complex Constraints for Vehicle Routing Problems

要約 配車経路問題 (VRP) は、現実世界の多くのシナリオをモデル化でき、多く … 続きを読む

カテゴリー: cs.AI, cs.LG | Learning to Handle Complex Constraints for Vehicle Routing Problems はコメントを受け付けていません

EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment

要約 計算タンパク質設計 (CPD) とは、タンパク質を設計するための計算手法の … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.BM | EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment はコメントを受け付けていません