cs.AI」カテゴリーアーカイブ

Training-Free Exponential Context Extension via Cascading KV Cache

要約 トランスのコンテキストウィンドウは、アクティブメモリ用の前のトークンを保存 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Training-Free Exponential Context Extension via Cascading KV Cache はコメントを受け付けていません

Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs

要約 大規模な言語モデル(LLMS)の最近の進歩は、自然言語で明示的な推論ステッ … 続きを読む

カテゴリー: cs.AI, cs.CL | Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs はコメントを受け付けていません

Pragmatic Reasoning improves LLM Code Generation

要約 大規模な言語モデル(LLM)は、自然言語(NL)の命令をプログラムコードに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | Pragmatic Reasoning improves LLM Code Generation はコメントを受け付けていません

Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization

要約 人間が超人的モデルの弱い監督者として機能する超整合は、大規模な言語モデル( … 続きを読む

カテゴリー: cs.AI, cs.CL | Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization はコメントを受け付けていません

PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information

要約 大規模な言語モデル(LLM)は、さまざまなドメインで質問に答える際に印象的 … 続きを読む

カテゴリー: cs.AI, cs.CL | PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information はコメントを受け付けていません

Re-evaluating Theory of Mind evaluation in large language models

要約 大規模な言語モデル(LLM)が心の理論(TOM)を持っているかどうかという … 続きを読む

カテゴリー: cs.AI, cs.CL | Re-evaluating Theory of Mind evaluation in large language models はコメントを受け付けていません

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

要約 環境、社会、およびガバナンス(ESG)の要因を企業の意思決定に統合すること … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CL, cs.CY, cs.IR | Optimizing Large Language Models for ESG Activity Detection in Financial Texts はコメントを受け付けていません

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

要約 大規模な言語モデル(LLM)は大規模な規模のコーパスで事前に処理されるため … 続きを読む

カテゴリー: cs.AI, cs.CL | AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models はコメントを受け付けていません

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

要約 ソーシャルメディアの指数関数的な成長は、デジタル時代の前例を超える情報の作 … 続きを読む

カテゴリー: cs.AI, cs.CL | GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse はコメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

要約 大規模な言語モデル(LLMS)は、多様なタスク全体で並外れたパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training はコメントを受け付けていません