「cs.LG」カテゴリーアーカイブ

Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention

投稿日: 2024年10月10日作成者: jarxiv

要約グラフニューラルネットワーク (GNN) は、グラフ構造データの機械学 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE | コメントを受け付けていません

ReIFE: Re-evaluating Instruction-Following Evaluation

投稿日: 2024年10月10日作成者: jarxiv

要約通常、次の指示の自動評価には、大規模言語モデル (LLM) を使用して応答 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Retrieval-Augmented Decision Transformer: External Memory for In-context RL

投稿日: 2024年10月10日作成者: jarxiv

要約インコンテキスト学習 (ICL) は、コンテキスト内でいくつかのサンプルを … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses

投稿日: 2024年10月10日作成者: jarxiv

要約科学的発見は人間社会の繁栄に大きく貢献しており、最近の進歩により、LLM … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots

投稿日: 2024年10月10日作成者: jarxiv

要約ソフトウェアエンジニアリング (SE) チャットボットは、開発プロセスの … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントを受け付けていません

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなタスクを実行しながら、多数の業 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The FIX Benchmark: Extracting Features Interpretable to eXperts

投稿日: 2024年10月10日作成者: jarxiv

要約特徴ベースの手法は、モデルの予測を説明するためによく使用されますが、これら … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

投稿日: 2024年10月10日作成者: jarxiv

要約 AlpacaEval 2.0、Arena-Hard-Auto、MT-Ben … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

投稿日: 2024年10月10日作成者: jarxiv

要約トランスフォーマーベースの言語モデルに対するリカレントニューラルネット … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

投稿日: 2024年10月10日作成者: jarxiv

要約近年、トレーニングデータアトリビューション (TDA) 手法が、ニュー … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention

ReIFE: Re-evaluating Instruction-Following Evaluation

Retrieval-Augmented Decision Transformer: External Memory for In-context RL

MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses

An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots

DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining

The FIX Benchmark: Extracting Features Interpretable to eXperts

Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates

Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

最近の投稿

最近のコメント

アーカイブ

カテゴリー