cs.CL」カテゴリーアーカイブ

TEG-DB: A Comprehensive Dataset and Benchmark of Textual-Edge Graphs

要約 Text-Attributed Graphs (TAG) は、自然言語によ … 続きを読む

カテゴリー: cs.AI, cs.CL | TEG-DB: A Comprehensive Dataset and Benchmark of Textual-Edge Graphs はコメントを受け付けていません

FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web

要約 事前トレーニング データセットの品質とサイズは、大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL, cs.DB | FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web はコメントを受け付けていません

HQP: A Human-Annotated Dataset for Detecting Online Propaganda

要約 オンライン プロパガンダは、社会の健全性に対して重大な脅威をもたらします。 … 続きを読む

カテゴリー: cs.CL | HQP: A Human-Annotated Dataset for Detecting Online Propaganda はコメントを受け付けていません

A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights

要約 テキスト データの急激な増加により、特にストレージと処理のコストが高くつく … 続きを読む

カテゴリー: cs.CL | A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights はコメントを受け付けていません

Finding Structure in Language Models

要約 私たちが話したり、書いたり、聞いたりするとき、言語の文法の知識に基づいて予 … 続きを読む

カテゴリー: cs.CL | Finding Structure in Language Models はコメントを受け付けていません

Learning by Analogy: Enhancing Few-Shot Prompting for Math Word Problem Solving with Computational Graph-Based Retrieval

要約 大規模言語モデル (LLM) は、数学の文章題 (MWP) などの複雑な推 … 続きを読む

カテゴリー: cs.CL | Learning by Analogy: Enhancing Few-Shot Prompting for Math Word Problem Solving with Computational Graph-Based Retrieval はコメントを受け付けていません

AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning

要約 大規模言語モデル (LLM) の最近の進歩により、さまざまな自然言語処理タ … 続きを読む

カテゴリー: cs.CL | AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning はコメントを受け付けていません

Profiling Bias in LLMs: Stereotype Dimensions in Contextual Word Embeddings

要約 大規模言語モデル (LLM) は、人工知能 (AI) の現在の成功の基盤で … 続きを読む

カテゴリー: cs.CL | Profiling Bias in LLMs: Stereotype Dimensions in Contextual Word Embeddings はコメントを受け付けていません

EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code

要約 ソフトウェアの脆弱性の自動検出はセキュリティを強化するために重要ですが、既 … 続きを読む

カテゴリー: cs.CL, cs.SE | EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code はコメントを受け付けていません

Efficient Interactive LLM Serving with Proxy Model-based Sequence Length Prediction

要約 大規模言語モデル (LLM) は、多数のドメインにわたって対話型 AI ア … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Efficient Interactive LLM Serving with Proxy Model-based Sequence Length Prediction はコメントを受け付けていません