「cs.CL」カテゴリーアーカイブ

Evaluating and Improving Graph to Text Generation with Large Language Models

投稿日: 2025年2月17日作成者: jarxiv

要約大規模な言語モデル（LLM）は、さまざまなタスクにわたって大きな可能性を示 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers

投稿日: 2025年2月17日作成者: jarxiv

要約この論文では、検索問題を紹介します。これは、入力サイズで対数的に成長する最 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Small Models, Big Impact: Efficient Corpus and Graph-Based Adaptation of Small Multilingual Language Models for Low-Resource Languages

投稿日: 2025年2月17日作成者: jarxiv

要約低リソース言語（LRL）は、データが限られているため、自然言語処理（NLP … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

A Unified Approach to Routing and Cascading for LLMs

投稿日: 2025年2月17日作成者: jarxiv

要約さまざまなエージェントシステムに組み込まれた幅広い大型言語モデル（LLM） … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Context-Aware or Context-Insensitive? Assessing LLMs’ Performance in Document-Level Translation

投稿日: 2025年2月17日作成者: jarxiv

要約大規模な言語モデル（LLM）は、機械翻訳においてますます強い候補です。こ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection

投稿日: 2025年2月17日作成者: jarxiv

要約ヘイトスピーチの急増は、社会に大きな害をもたらしました。憎しみの強度と方 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Self-Refinement Strategies for LLM-based Product Attribute Value Extraction

投稿日: 2025年2月17日作成者: jarxiv

要約属性値のペアの形式での構造化された製品データは、eコマースプラットフォーム … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Can Post-Training Quantization Benefit from an Additional QLoRA Integration?

投稿日: 2025年2月17日作成者: jarxiv

要約大規模な言語モデル（LLM）は自然言語処理を変革しましたが、実際の展開に大 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

A distributional simplicity bias in the learning dynamics of transformers

投稿日: 2025年2月17日作成者: jarxiv

要約効果的に一般化するための過剰パラメーター化されたニューラルネットワークの顕 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification

投稿日: 2025年2月17日作成者: jarxiv

要約テキスト分類は、データマイニングの基本的なタスクであり、表形式の理解や推奨 … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Evaluating and Improving Graph to Text Generation with Large Language Models

Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers

Small Models, Big Impact: Efficient Corpus and Graph-Based Adaptation of Small Multilingual Language Models for Low-Resource Languages

A Unified Approach to Routing and Cascading for LLMs

Context-Aware or Context-Insensitive? Assessing LLMs’ Performance in Document-Level Translation

STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection

Self-Refinement Strategies for LLM-based Product Attribute Value Extraction

Can Post-Training Quantization Benefit from an Additional QLoRA Integration?

A distributional simplicity bias in the learning dynamics of transformers

Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー