月別アーカイブ: 2024年3月

Token Alignment via Character Matching for Subword Completion

要約 さまざまなアプリケーションで広く利用されている生成モデルは、部分的なトーク … 続きを読む

カテゴリー: cs.AI, cs.CL | Token Alignment via Character Matching for Subword Completion はコメントを受け付けていません

AGI: Artificial General Intelligence for Education

要約 汎用人工知能 (AGI) は、画期的な大規模言語モデルと、それぞれ GPT … 続きを読む

カテゴリー: cs.AI | AGI: Artificial General Intelligence for Education はコメントを受け付けていません

Linear attention is (maybe) all you need (to understand transformer optimization)

要約 トランスフォーマーのトレーニングは難しいことで知られており、オプティマイザ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Linear attention is (maybe) all you need (to understand transformer optimization) はコメントを受け付けていません

mForms : Multimodal Form-Filling with Question Answering

要約 この論文では、タスクをマルチモーダル自然言語質問応答 (QA) として再定 … 続きを読む

カテゴリー: cs.AI | mForms : Multimodal Form-Filling with Question Answering はコメントを受け付けていません

Implicit Regularization of Gradient Flow on One-Layer Softmax Attention

要約 キー重み行列とクエリ重み行列が個別にトレーニングされる、1 層ソフトマック … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | Implicit Regularization of Gradient Flow on One-Layer Softmax Attention はコメントを受け付けていません

GenTKG: Generative Forecasting on Temporal Knowledge Graph

要約 大規模言語モデル (LLM) の急速な進歩により、従来の埋め込みベースおよ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GenTKG: Generative Forecasting on Temporal Knowledge Graph はコメントを受け付けていません

A Hitchhiker’s Guide to Geometric GNNs for 3D Atomic Systems

要約 分子、タンパク質、材料にまたがる原子システムの計算モデリングにおける最近の … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.QM, stat.ML | A Hitchhiker’s Guide to Geometric GNNs for 3D Atomic Systems はコメントを受け付けていません

Demystifying Embedding Spaces using Large Language Models

要約 埋め込みは、エンティティ、概念、関係に関する複雑で多面的な情報を、凝縮され … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Demystifying Embedding Spaces using Large Language Models はコメントを受け付けていません

The Garden of Forking Paths: Observing Dynamic Parameters Distribution in Large Language Models

要約 NLP における Transformer アーキテクチャの優れたパフォーマ … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.CL | The Garden of Forking Paths: Observing Dynamic Parameters Distribution in Large Language Models はコメントを受け付けていません

Steering LLMs Towards Unbiased Responses: A Causality-Guided Debiasing Framework

要約 大規模言語モデル (LLM) は、偏った差別的な応答を簡単に生成する可能性 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Steering LLMs Towards Unbiased Responses: A Causality-Guided Debiasing Framework はコメントを受け付けていません