「cs.AI」カテゴリーアーカイブ

Training-Free Exponential Context Extension via Cascading KV Cache

投稿日: 2025年3月3日作成者: jarxiv

要約トランスのコンテキストウィンドウは、アクティブメモリ用の前のトークンを保存 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLMS）の最近の進歩は、自然言語で明示的な推論ステッ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Pragmatic Reasoning improves LLM Code Generation

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、自然言語（NL）の命令をプログラムコードに … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization

投稿日: 2025年3月3日作成者: jarxiv

要約人間が超人的モデルの弱い監督者として機能する超整合は、大規模な言語モデル（ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は、さまざまなドメインで質問に答える際に印象的 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Re-evaluating Theory of Mind evaluation in large language models

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）が心の理論（TOM）を持っているかどうかという … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

投稿日: 2025年3月3日作成者: jarxiv

要約環境、社会、およびガバナンス（ESG）の要因を企業の意思決定に統合すること … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.CL, cs.CY, cs.IR | コメントを受け付けていません

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLM）は大規模な規模のコーパスで事前に処理されるため … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

投稿日: 2025年3月3日作成者: jarxiv

要約ソーシャルメディアの指数関数的な成長は、デジタル時代の前例を超える情報の作 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

投稿日: 2025年3月3日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、多様なタスク全体で並外れたパフォーマンス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Training-Free Exponential Context Extension via Cascading KV Cache

Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs

Pragmatic Reasoning improves LLM Code Generation

Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization

PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information

Re-evaluating Theory of Mind evaluation in large language models

Optimizing Large Language Models for ESG Activity Detection in Financial Texts

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training

最近の投稿

最近のコメント

アーカイブ

カテゴリー