cs.AI」カテゴリーアーカイブ

Policy Gradient Methods in the Presence of Symmetries and State Abstractions

要約 高次元の複雑な問題に関する強化学習 (RL) は、効率と一般化の向上のため … 続きを読む

カテゴリー: cs.AI, cs.LG | Policy Gradient Methods in the Presence of Symmetries and State Abstractions はコメントを受け付けていません

GenTKG: Generative Forecasting on Temporal Knowledge Graph

要約 大規模言語モデル (LLM) の急速な進歩により、従来の埋め込みベースおよ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GenTKG: Generative Forecasting on Temporal Knowledge Graph はコメントを受け付けていません

Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification

要約 大規模言語モデル (LLM) は、幻覚を引き起こすことで悪名高く、出力内に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification はコメントを受け付けていません

Common 7B Language Models Already Possess Strong Math Capabilities

要約 以前は、数学的機能は非常に大規模な場合にのみ共通言語モデルに現れるか、広範 … 続きを読む

カテゴリー: cs.AI, cs.CL | Common 7B Language Models Already Possess Strong Math Capabilities はコメントを受け付けていません

Is Scaling Learned Optimizers Worth It? Evaluating The Value of VeLO’s 4000 TPU Months

要約 私たちは、汎用の「基礎」オプティマイザーをトレーニングするこれまでで最大規 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Is Scaling Learned Optimizers Worth It? Evaluating The Value of VeLO’s 4000 TPU Months はコメントを受け付けていません

Merging Text Transformer Models from Different Initializations

要約 ワンショット順列ベースのモデル マージに関する最近の研究では、完全に異なる … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Merging Text Transformer Models from Different Initializations はコメントを受け付けていません

LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error

要約 大規模言語モデル (LLM) が最新の情報を取得し、外部環境で結果として生 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error はコメントを受け付けていません

GNN-VPA: A Variance-Preserving Aggregation Strategy for Graph Neural Networks

要約 グラフ ニューラル ネットワーク (GNN)、特にメッセージ パッシング … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | GNN-VPA: A Variance-Preserving Aggregation Strategy for Graph Neural Networks はコメントを受け付けていません

KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts

要約 最近、大規模な言語モデルの人気が高まっているため、テキストの要約、予測、生 … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG | KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts はコメントを受け付けていません

iScore: Visual Analytics for Interpreting How Language Models Automatically Score Summaries

要約 最近の大規模言語モデル (LLM) の人気の爆発的な増加を受けて、学習エン … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG | iScore: Visual Analytics for Interpreting How Language Models Automatically Score Summaries はコメントを受け付けていません