cs.LG」カテゴリーアーカイブ

NeMo-Inspector: A Visualization Tool for LLM Generation Analysis

要約 大規模言語モデル(LLM)を新しいタスクに適応させ、その全体的な能力を向上 … 続きを読む

カテゴリー: cs.CL, cs.LG | NeMo-Inspector: A Visualization Tool for LLM Generation Analysis はコメントを受け付けていません

How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias

要約 言語認識タスクは自然言語処理(NLP)の基本であり、大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias はコメントを受け付けていません

Llama-Nemotron: Efficient Reasoning Models

要約 Llama-Nemotronシリーズは、卓越した推論能力、推論効率、オープ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Llama-Nemotron: Efficient Reasoning Models はコメントを受け付けていません

Attack and defense techniques in large language models: A survey and new perspectives

要約 大規模言語モデル(LLM)は、多くの自然言語処理タスクの中心的存在となって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Attack and defense techniques in large language models: A survey and new perspectives はコメントを受け付けていません

Towards the Resistance of Neural Network Watermarking to Fine-tuning

要約 本稿では、ディープニューラルネットワーク(DNN)に所有者情報を埋め込むた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Towards the Resistance of Neural Network Watermarking to Fine-tuning はコメントを受け付けていません

Competition Dynamics Shape Algorithmic Phases of In-Context Learning

要約 文脈内学習(In-Context Learning: ICL)は、大規模言 … 続きを読む

カテゴリー: cs.CL, cs.LG | Competition Dynamics Shape Algorithmic Phases of In-Context Learning はコメントを受け付けていません

ICLR: In-Context Learning of Representations

要約 最近の研究では、事前学習データによって指定された意味論が、大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ICLR: In-Context Learning of Representations はコメントを受け付けていません

Clustering Internet Memes Through Template Matching and Multi-Dimensional Similarity

要約 ミームのクラスタリングは、毒性検出、バイラリティモデリング、タイピングのた … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG, cs.MM | Clustering Internet Memes Through Template Matching and Multi-Dimensional Similarity はコメントを受け付けていません

MoDeGPT: Modular Decomposition for Large Language Model Compression

要約 大規模言語モデル(LLM)は、様々なタスクにおいて卓越した性能を発揮するこ … 続きを読む

カテゴリー: (Primary), cs.CL, cs.LG, I.2.7, stat.ML | MoDeGPT: Modular Decomposition for Large Language Model Compression はコメントを受け付けていません

FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning

要約 大規模言語モデル(LLM)のファインチューニングはタスク適応に不可欠である … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning はコメントを受け付けていません