cs.AI」カテゴリーアーカイブ

ANLS* — A Universal Document Processing Metric for Generative Large Language Models

要約 従来、文書の分類や情報抽出などのタスクでは、識別モデルが主に選択されてきま … 続きを読む

カテゴリー: cs.AI, cs.CL | ANLS* — A Universal Document Processing Metric for Generative Large Language Models はコメントを受け付けていません

SimLM: Can Language Models Infer Parameters of Physical Systems?

要約 いくつかの機械学習手法は、複雑な物理システムについて学習または推論すること … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | SimLM: Can Language Models Infer Parameters of Physical Systems? はコメントを受け付けていません

Scaling Transformer to 1M tokens and beyond with RMT

要約 変換器によって解決できるより広い範囲の問題に対する主な制限は、入力サイズに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Scaling Transformer to 1M tokens and beyond with RMT はコメントを受け付けていません

Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language Models

要約 大規模言語モデル (LLM) は、数学的およびアルゴリズム的なタスクにおい … 続きを読む

カテゴリー: cs.AI, cs.CL | Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language Models はコメントを受け付けていません

DistiLLM: Towards Streamlined Distillation for Large Language Models

要約 知識蒸留 (KD) は、教師モデルをより小さな生徒モデルに圧縮するために広 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DistiLLM: Towards Streamlined Distillation for Large Language Models はコメントを受け付けていません

Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models

要約 大規模言語モデル (LLM) が言語理解タスクの大部分を占めていますが、以 … 続きを読む

カテゴリー: cs.AI, cs.CL | Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models はコメントを受け付けていません

Leak, Cheat, Repeat: Data Contamination and Evaluation Malpractices in Closed-Source LLMs

要約 自然言語処理 (NLP) 研究では、大規模言語モデル (LLM) の使用に … 続きを読む

カテゴリー: cs.AI, cs.CL | Leak, Cheat, Repeat: Data Contamination and Evaluation Malpractices in Closed-Source LLMs はコメントを受け付けていません

Position Paper: Against Spurious Sparks-Dovelating Inflated AI Claims

要約 人間は、周囲の物体に「人間」らしさを見る傾向があります。 私たちは、あたか … 続きを読む

カテゴリー: cs.AI, cs.CL | Position Paper: Against Spurious Sparks-Dovelating Inflated AI Claims はコメントを受け付けていません

IM-META: Influence Maximization Using Node Metadata in Networks With Unknown Topology

要約 複雑なネットワークの構造は不明なことが多いため、ノード クエリの予算が少な … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, cs.NE, cs.SI, math.IT | IM-META: Influence Maximization Using Node Metadata in Networks With Unknown Topology はコメントを受け付けていません

AlbNews: A Corpus of Headlines for Topic Modeling in Albanian

要約 アルバニア語のような低リソース言語では利用可能なテキスト コーパスが不足し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AlbNews: A Corpus of Headlines for Topic Modeling in Albanian はコメントを受け付けていません