「cs.AI」カテゴリーアーカイブ

Policy Gradient Methods in the Presence of Symmetries and State Abstractions

投稿日: 2024年3月8日作成者: jarxiv

要約高次元の複雑な問題に関する強化学習 (RL) は、効率と一般化の向上のため … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

GenTKG: Generative Forecasting on Temporal Knowledge Graph

投稿日: 2024年3月8日作成者: jarxiv

要約大規模言語モデル (LLM) の急速な進歩により、従来の埋め込みベースおよ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification

投稿日: 2024年3月8日作成者: jarxiv

要約大規模言語モデル (LLM) は、幻覚を引き起こすことで悪名高く、出力内に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Common 7B Language Models Already Possess Strong Math Capabilities

投稿日: 2024年3月8日作成者: jarxiv

要約以前は、数学的機能は非常に大規模な場合にのみ共通言語モデルに現れるか、広範 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Is Scaling Learned Optimizers Worth It? Evaluating The Value of VeLO’s 4000 TPU Months

投稿日: 2024年3月8日作成者: jarxiv

要約私たちは、汎用の「基礎」オプティマイザーをトレーニングするこれまでで最大規 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Merging Text Transformer Models from Different Initializations

投稿日: 2024年3月8日作成者: jarxiv

要約ワンショット順列ベースのモデルマージに関する最近の研究では、完全に異なる … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error

投稿日: 2024年3月8日作成者: jarxiv

要約大規模言語モデル (LLM) が最新の情報を取得し、外部環境で結果として生 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

GNN-VPA: A Variance-Preserving Aggregation Strategy for Graph Neural Networks

投稿日: 2024年3月8日作成者: jarxiv

要約グラフニューラルネットワーク (GNN)、特にメッセージパッシング … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts

投稿日: 2024年3月8日作成者: jarxiv

要約最近、大規模な言語モデルの人気が高まっているため、テキストの要約、予測、生 … 続きを読む →

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

iScore: Visual Analytics for Interpreting How Language Models Automatically Score Summaries

投稿日: 2024年3月8日作成者: jarxiv

要約最近の大規模言語モデル (LLM) の人気の爆発的な増加を受けて、学習エン … 続きを読む →

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Policy Gradient Methods in the Presence of Symmetries and State Abstractions

GenTKG: Generative Forecasting on Temporal Knowledge Graph

Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification

Common 7B Language Models Already Possess Strong Math Capabilities

Is Scaling Learned Optimizers Worth It? Evaluating The Value of VeLO’s 4000 TPU Months

Merging Text Transformer Models from Different Initializations

LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error

GNN-VPA: A Variance-Preserving Aggregation Strategy for Graph Neural Networks

KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts

iScore: Visual Analytics for Interpreting How Language Models Automatically Score Summaries

最近の投稿

最近のコメント

アーカイブ

カテゴリー