月別アーカイブ: 2024年10月

PromptExp: Multi-granularity Prompt Explanation of Large Language Models

要約 大規模言語モデルは、自然言語理解やテキスト生成などのタスクに優れています。 … 続きを読む

カテゴリー: cs.CL | コメントする

Controlling Language and Diffusion Models by Transporting Activations

要約 大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む

カテゴリー: 49Q22, 68T07, cs.AI, cs.CL, cs.CV, cs.LG, I.2.6 | コメントする

Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models

要約 言語モデル (LM) 表現にはどのような潜在的な機能がエンコードされていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Don’t Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification

要約 最先端のエクストリーム マルチラベル テキスト分類 (XMTC) モデルは … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

MiniPLM: Knowledge Distillation for Pre-Training Language Models

要約 知識蒸留 (KD) は、大規模な教師 LM を使用して、小規模でパフォーマ … 続きを読む

カテゴリー: cs.CL | コメントする

Multi-Programming Language Sandbox for LLMs

要約 MPLSandbox は、大規模言語モデル (LLM) のコンパイラおよび … 続きを読む

カテゴリー: cs.CL, cs.SE | コメントする

Benchmarking Agentic Workflow Generation

要約 大規模言語モデル (LLM) は、幅広いタスクを処理する優れた能力を備えて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.MA | コメントする

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

要約 大規模言語モデル (LLM) 推論の計算上の課題は、特にプロンプ​​トの長 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference

要約 大規模言語モデル (LLM) は自然言語処理に不可欠ですが、多くの場合、推 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation

要約 検索拡張生成 (RAG) は、外部知識の検索を通じて大規模言語モデル (L … 続きを読む

カテゴリー: cs.CL, cs.IR | コメントする