cs.LG」カテゴリーアーカイブ

Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention

要約 グラフ ニューラル ネットワーク (GNN) は、グラフ構造データの機械学 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention はコメントを受け付けていません

ReIFE: Re-evaluating Instruction-Following Evaluation

要約 通常、次の指示の自動評価には、大規模言語モデル (LLM) を使用して応答 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ReIFE: Re-evaluating Instruction-Following Evaluation はコメントを受け付けていません

Retrieval-Augmented Decision Transformer: External Memory for In-context RL

要約 インコンテキスト学習 (ICL) は、コンテキスト内でいくつかのサンプルを … 続きを読む

カテゴリー: cs.AI, cs.LG | Retrieval-Augmented Decision Transformer: External Memory for In-context RL はコメントを受け付けていません

MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses

要約 科学的発見は人間社会の繁栄に大きく貢献しており、最近の進歩により、LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses はコメントを受け付けていません

An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots

要約 ソフトウェア エンジニアリング (SE) チャットボットは、開発プロセスの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots はコメントを受け付けていません

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

要約 大規模言語モデル (LLM) は、さまざまなタスクを実行しながら、多数の業 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining はコメントを受け付けていません

The FIX Benchmark: Extracting Features Interpretable to eXperts

要約 特徴ベースの手法は、モデルの予測を説明するためによく使用されますが、これら … 続きを読む

カテゴリー: cs.AI, cs.LG | The FIX Benchmark: Extracting Features Interpretable to eXperts はコメントを受け付けていません

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

要約 AlpacaEval 2.0、Arena-Hard-Auto、MT-Ben … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates はコメントを受け付けていません

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

要約 トランスフォーマーベースの言語モデルに対するリカレント ニューラル ネット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling はコメントを受け付けていません

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

要約 近年、トレーニング データ アトリビューション (TDA) 手法が、ニュー … 続きを読む

カテゴリー: cs.AI, cs.LG | Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond はコメントを受け付けていません