月別アーカイブ: 2024年10月

PromptExp: Multi-granularity Prompt Explanation of Large Language Models

投稿日: 2024年10月31日作成者: jarxiv

要約大規模言語モデルは、自然言語理解やテキスト生成などのタスクに優れています。 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Controlling Language and Diffusion Models by Transporting Activations

投稿日: 2024年10月31日作成者: jarxiv

要約大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む →

カテゴリー: 49Q22, 68T07, cs.AI, cs.CL, cs.CV, cs.LG, I.2.6 | コメントを受け付けていません

Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models

投稿日: 2024年10月31日作成者: jarxiv

要約言語モデル (LM) 表現にはどのような潜在的な機能がエンコードされていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Don’t Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification

投稿日: 2024年10月31日作成者: jarxiv

要約最先端のエクストリームマルチラベルテキスト分類 (XMTC) モデルは … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

MiniPLM: Knowledge Distillation for Pre-Training Language Models

投稿日: 2024年10月31日作成者: jarxiv

要約知識蒸留 (KD) は、大規模な教師 LM を使用して、小規模でパフォーマ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Multi-Programming Language Sandbox for LLMs

投稿日: 2024年10月31日作成者: jarxiv

要約 MPLSandbox は、大規模言語モデル (LLM) のコンパイラおよび … 続きを読む →

カテゴリー: cs.CL, cs.SE | コメントを受け付けていません

Benchmarking Agentic Workflow Generation

投稿日: 2024年10月31日作成者: jarxiv

要約大規模言語モデル (LLM) は、幅広いタスクを処理する優れた能力を備えて … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.MA | コメントを受け付けていません

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

投稿日: 2024年10月31日作成者: jarxiv

要約大規模言語モデル (LLM) 推論の計算上の課題は、特にプロンプトの長 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference

投稿日: 2024年10月31日作成者: jarxiv

要約大規模言語モデル (LLM) は自然言語処理に不可欠ですが、多くの場合、推 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation

投稿日: 2024年10月31日作成者: jarxiv

要約検索拡張生成 (RAG) は、外部知識の検索を通じて大規模言語モデル (L … 続きを読む →

カテゴリー: cs.CL, cs.IR | コメントを受け付けていません

月別アーカイブ: 2024年10月

PromptExp: Multi-granularity Prompt Explanation of Large Language Models

Controlling Language and Diffusion Models by Transporting Activations

Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models

Don’t Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification

MiniPLM: Knowledge Distillation for Pre-Training Language Models

Multi-Programming Language Sandbox for LLMs

Benchmarking Agentic Workflow Generation

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference

CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー