cs.AI」カテゴリーアーカイブ

Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models

要約 言語モデル (LM) 表現にはどのような潜在的な機能がエンコードされていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models はコメントを受け付けていません

Benchmarking Agentic Workflow Generation

要約 大規模言語モデル (LLM) は、幅広いタスクを処理する優れた能力を備えて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.MA | Benchmarking Agentic Workflow Generation はコメントを受け付けていません

BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference

要約 大規模言語モデル (LLM) は自然言語処理に不可欠ですが、多くの場合、推 … 続きを読む

カテゴリー: cs.AI, cs.CL | BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference はコメントを受け付けていません

Comparative Analysis of Demonstration Selection Algorithms for LLM In-Context Learning

要約 インコンテキスト学習は、大規模言語モデル (LLM) が追加のトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Comparative Analysis of Demonstration Selection Algorithms for LLM In-Context Learning はコメントを受け付けていません

Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction

要約 従来の 2 値リレーショナル ファクトを超えて、n 値リレーショナル ナレ … 続きを読む

カテゴリー: cs.AI, cs.CL | Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction はコメントを受け付けていません

ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models

要約 ナレッジ ベースの質問応答 (KBQA) は、大規模なナレッジ ベース ( … 続きを読む

カテゴリー: cs.AI, cs.CL | ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models はコメントを受け付けていません

Why Gradient Subspace? Identifying and Mitigating LoRA’s Bottlenecks in Federated Fine-Tuning of Large Language Models

要約 大規模言語モデル (LLM) は、さまざまなドメインにわたって、特にテキス … 続きを読む

カテゴリー: cs.AI, cs.LG | Why Gradient Subspace? Identifying and Mitigating LoRA’s Bottlenecks in Federated Fine-Tuning of Large Language Models はコメントを受け付けていません

Continuous Product Graph Neural Networks

要約 複数のグラフ上で定義されたマルチドメイン データの処理は、コンピューター … 続きを読む

カテゴリー: cs.AI, cs.LG | Continuous Product Graph Neural Networks はコメントを受け付けていません

Teaching a Language Model to Distinguish Between Similar Details using a Small Adversarial Training Set

要約 言語モデルは、NLI などの自然言語タスクでは高い精度を達成できますが、手 … 続きを読む

カテゴリー: cs.AI, cs.CL | Teaching a Language Model to Distinguish Between Similar Details using a Small Adversarial Training Set はコメントを受け付けていません

Dynamic Vocabulary Pruning in Early-Exit LLMs

要約 大規模言語モデル (LLM) のサイズを増やすと、パフォーマンスが向上する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Dynamic Vocabulary Pruning in Early-Exit LLMs はコメントを受け付けていません