「cs.CL」カテゴリーアーカイブ

Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization

投稿日: 2024年10月3日作成者: jarxiv

要約言語モデルは、トレーニングデータから社会的バイアスを継承することがよくあ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian

投稿日: 2024年10月2日作成者: jarxiv

要約ノルウェー語はわずか 500 万人の人口で話されていますが、NLP タスク … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Privacy Evaluation Benchmarks for NLP Models

投稿日: 2024年10月2日作成者: jarxiv

要約 NLP モデルに対してプライバシー攻撃を誘発することにより、攻撃者はトレー … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Block-Attention for Efficient RAG

投稿日: 2024年10月2日作成者: jarxiv

要約取得拡張生成 (RAG) シナリオにおける推論レイテンシとコストの増大に対 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs

投稿日: 2024年10月2日作成者: jarxiv

要約人間が書いた記事では、太字や斜体などのテキストスタイルの微妙な点を利用し … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

How Far Are We from Intelligent Visual Deductive Reasoning?

投稿日: 2024年10月2日作成者: jarxiv

要約視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation

投稿日: 2024年10月2日作成者: jarxiv

要約検索拡張生成 (RAG) は、大規模な言語モデルにおける静的知識と幻覚の問 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Weak-to-Strong Reasoning

投稿日: 2024年10月2日作成者: jarxiv

要約大規模言語モデル (LLM) が人間レベルの能力を超えると、これらのモデル … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Federated Instruction Tuning of LLMs with Domain Coverage Augmentation

投稿日: 2024年10月2日作成者: jarxiv

要約 Federated Domain-specific structuning … 続きを読む →

カテゴリー: cs.CL, cs.DC, cs.LG | コメントを受け付けていません

FLEX: Expert-level False-Less EXecution Metric for Reliable Text-to-SQL Benchmark

投稿日: 2024年10月2日作成者: jarxiv

要約 Text-to-SQL テクノロジーは、さまざまな業界で自然言語を SQL … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization

NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian

Privacy Evaluation Benchmarks for NLP Models

Block-Attention for Efficient RAG

Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs

How Far Are We from Intelligent Visual Deductive Reasoning?

RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation

Weak-to-Strong Reasoning

Federated Instruction Tuning of LLMs with Domain Coverage Augmentation

FLEX: Expert-level False-Less EXecution Metric for Reliable Text-to-SQL Benchmark

最近の投稿

最近のコメント

アーカイブ

カテゴリー