cs.CL」カテゴリーアーカイブ

Evaluating and Improving Graph to Text Generation with Large Language Models

要約 大規模な言語モデル(LLM)は、さまざまなタスクにわたって大きな可能性を示 … 続きを読む

カテゴリー: cs.CL | Evaluating and Improving Graph to Text Generation with Large Language Models はコメントを受け付けていません

Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers

要約 この論文では、検索問題を紹介します。これは、入力サイズで対数的に成長する最 … 続きを読む

カテゴリー: cs.CL, cs.LG | Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers はコメントを受け付けていません

Small Models, Big Impact: Efficient Corpus and Graph-Based Adaptation of Small Multilingual Language Models for Low-Resource Languages

要約 低リソース言語(LRL)は、データが限られているため、自然言語処理(NLP … 続きを読む

カテゴリー: cs.CL | Small Models, Big Impact: Efficient Corpus and Graph-Based Adaptation of Small Multilingual Language Models for Low-Resource Languages はコメントを受け付けていません

A Unified Approach to Routing and Cascading for LLMs

要約 さまざまなエージェントシステムに組み込まれた幅広い大型言語モデル(LLM) … 続きを読む

カテゴリー: cs.CL | A Unified Approach to Routing and Cascading for LLMs はコメントを受け付けていません

Context-Aware or Context-Insensitive? Assessing LLMs’ Performance in Document-Level Translation

要約 大規模な言語モデル(LLM)は、機械翻訳においてますます強い候補です。 こ … 続きを読む

カテゴリー: cs.CL | Context-Aware or Context-Insensitive? Assessing LLMs’ Performance in Document-Level Translation はコメントを受け付けていません

STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection

要約 ヘイトスピーチの急増は、社会に大きな害をもたらしました。 憎しみの強度と方 … 続きを読む

カテゴリー: cs.CL | STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection はコメントを受け付けていません

Self-Refinement Strategies for LLM-based Product Attribute Value Extraction

要約 属性値のペアの形式での構造化された製品データは、eコマースプラットフォーム … 続きを読む

カテゴリー: cs.CL | Self-Refinement Strategies for LLM-based Product Attribute Value Extraction はコメントを受け付けていません

Can Post-Training Quantization Benefit from an Additional QLoRA Integration?

要約 大規模な言語モデル(LLM)は自然言語処理を変革しましたが、実際の展開に大 … 続きを読む

カテゴリー: cs.CL | Can Post-Training Quantization Benefit from an Additional QLoRA Integration? はコメントを受け付けていません

A distributional simplicity bias in the learning dynamics of transformers

要約 効果的に一般化するための過剰パラメーター化されたニューラルネットワークの顕 … 続きを読む

カテゴリー: cs.CL | A distributional simplicity bias in the learning dynamics of transformers はコメントを受け付けていません

Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification

要約 テキスト分類は、データマイニングの基本的なタスクであり、表形式の理解や推奨 … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification はコメントを受け付けていません