「cs.AI」カテゴリーアーカイブ

ANLS* — A Universal Document Processing Metric for Generative Large Language Models

投稿日: 2024年2月7日作成者: jarxiv

要約従来、文書の分類や情報抽出などのタスクでは、識別モデルが主に選択されてきま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SimLM: Can Language Models Infer Parameters of Physical Systems?

投稿日: 2024年2月7日作成者: jarxiv

要約いくつかの機械学習手法は、複雑な物理システムについて学習または推論すること … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

Scaling Transformer to 1M tokens and beyond with RMT

投稿日: 2024年2月7日作成者: jarxiv

要約変換器によって解決できるより広い範囲の問題に対する主な制限は、入力サイズに … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language Models

投稿日: 2024年2月7日作成者: jarxiv

要約大規模言語モデル (LLM) は、数学的およびアルゴリズム的なタスクにおい … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

DistiLLM: Towards Streamlined Distillation for Large Language Models

投稿日: 2024年2月7日作成者: jarxiv

要約知識蒸留 (KD) は、教師モデルをより小さな生徒モデルに圧縮するために広 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models

投稿日: 2024年2月7日作成者: jarxiv

要約大規模言語モデル (LLM) が言語理解タスクの大部分を占めていますが、以 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Leak, Cheat, Repeat: Data Contamination and Evaluation Malpractices in Closed-Source LLMs

投稿日: 2024年2月7日作成者: jarxiv

要約自然言語処理 (NLP) 研究では、大規模言語モデル (LLM) の使用に … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Position Paper: Against Spurious Sparks-Dovelating Inflated AI Claims

投稿日: 2024年2月7日作成者: jarxiv

要約人間は、周囲の物体に「人間」らしさを見る傾向があります。私たちは、あたか … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

IM-META: Influence Maximization Using Node Metadata in Networks With Unknown Topology

投稿日: 2024年2月7日作成者: jarxiv

要約複雑なネットワークの構造は不明なことが多いため、ノードクエリの予算が少な … 続きを読む →

カテゴリー: cs.AI, cs.IT, cs.LG, cs.NE, cs.SI, math.IT | コメントを受け付けていません

AlbNews: A Corpus of Headlines for Topic Modeling in Albanian

投稿日: 2024年2月7日作成者: jarxiv

要約アルバニア語のような低リソース言語では利用可能なテキストコーパスが不足し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

ANLS* — A Universal Document Processing Metric for Generative Large Language Models

SimLM: Can Language Models Infer Parameters of Physical Systems?

Scaling Transformer to 1M tokens and beyond with RMT

Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large Language Models

DistiLLM: Towards Streamlined Distillation for Large Language Models

Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models

Leak, Cheat, Repeat: Data Contamination and Evaluation Malpractices in Closed-Source LLMs

Position Paper: Against Spurious Sparks-Dovelating Inflated AI Claims

IM-META: Influence Maximization Using Node Metadata in Networks With Unknown Topology

AlbNews: A Corpus of Headlines for Topic Modeling in Albanian

最近の投稿

最近のコメント

アーカイブ

カテゴリー