cs.CL」カテゴリーアーカイブ

Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization

要約 言語モデルは、トレーニング データから社会的バイアスを継承することがよくあ … 続きを読む

カテゴリー: cs.AI, cs.CL | Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization はコメントを受け付けていません

NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian

要約 ノルウェー語はわずか 500 万人の人口で話されていますが、NLP タスク … 続きを読む

カテゴリー: cs.CL | NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian はコメントを受け付けていません

Privacy Evaluation Benchmarks for NLP Models

要約 NLP モデルに対してプライバシー攻撃を誘発することにより、攻撃者はトレー … 続きを読む

カテゴリー: cs.CL, cs.LG | Privacy Evaluation Benchmarks for NLP Models はコメントを受け付けていません

Block-Attention for Efficient RAG

要約 取得拡張生成 (RAG) シナリオにおける推論レイテンシとコストの増大に対 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Block-Attention for Efficient RAG はコメントを受け付けていません

Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs

要約 人間が書いた記事では、太字や斜体などのテキスト スタイルの微妙な点を利用し … 続きを読む

カテゴリー: cs.CL, cs.LG | Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs はコメントを受け付けていません

How Far Are We from Intelligent Visual Deductive Reasoning?

要約 視覚言語モデル (VLM) は最近、多様な視覚言語タスクにおいて驚くべき進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | How Far Are We from Intelligent Visual Deductive Reasoning? はコメントを受け付けていません

RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation

要約 検索拡張生成 (RAG) は、大規模な言語モデルにおける静的知識と幻覚の問 … 続きを読む

カテゴリー: cs.CL | RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation はコメントを受け付けていません

Weak-to-Strong Reasoning

要約 大規模言語モデル (LLM) が人間レベルの能力を超えると、これらのモデル … 続きを読む

カテゴリー: cs.AI, cs.CL | Weak-to-Strong Reasoning はコメントを受け付けていません

Federated Instruction Tuning of LLMs with Domain Coverage Augmentation

要約 Federated Domain-specific structuning … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Federated Instruction Tuning of LLMs with Domain Coverage Augmentation はコメントを受け付けていません

FLEX: Expert-level False-Less EXecution Metric for Reliable Text-to-SQL Benchmark

要約 Text-to-SQL テクノロジーは、さまざまな業界で自然言語を SQL … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | FLEX: Expert-level False-Less EXecution Metric for Reliable Text-to-SQL Benchmark はコメントを受け付けていません