cs.AI」カテゴリーアーカイブ

The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity

要約 この論文では、回路の複雑さフレームワークを使用して、MAMBAおよび状態空 … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CL, cs.LG | The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity はコメントを受け付けていません

eC-Tab2Text: Aspect-Based Text Generation from e-Commerce Product Tables

要約 大規模な言語モデル(LLMS)は、多様なドメイン全体で並外れた汎用性を実証 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB, cs.HC | eC-Tab2Text: Aspect-Based Text Generation from e-Commerce Product Tables はコメントを受け付けていません

Large Language Model Confidence Estimation via Black-Box Access

要約 モデルの応答に対する不確実性または自信を推定することは、応答だけでなく、モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Model Confidence Estimation via Black-Box Access はコメントを受け付けていません

Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs

要約 大規模な言語モデルは、微調整を通じてタスク固有のアプリケーションで顕著な能 … 続きを読む

カテゴリー: cs.AI, cs.CL | Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs はコメントを受け付けていません

Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension

要約 低メモリの要件と速い収束を備えた大規模な言語モデル(LLMS)の効率的なオ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension はコメントを受け付けていません

Towards Economical Inference: Enabling DeepSeek’s Multi-Head Latent Attention in Any Transformer-based LLMs

要約 Multi-Head Latent Atterness(MLA)は、Key … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards Economical Inference: Enabling DeepSeek’s Multi-Head Latent Attention in Any Transformer-based LLMs はコメントを受け付けていません

Revealing and Mitigating Over-Attention in Knowledge Editing

要約 大規模な言語モデルは、幅広いタスクで優れたパフォーマンスを実証していますが … 続きを読む

カテゴリー: cs.AI, cs.CL | Revealing and Mitigating Over-Attention in Knowledge Editing はコメントを受け付けていません

Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification

要約 サンプリングベースの検索は、テスト時間計算を利用するための単純なパラダイム … 続きを読む

カテゴリー: cs.AI, cs.LG | Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification はコメントを受け付けていません

FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling

要約 投機的なサンプリングは、ドラフト – ヴェイロ化メカニズムを利 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling はコメントを受け付けていません

Interpretable Text Embeddings and Text Similarity Explanation: A Primer

要約 テキストの埋め込みモデルとテキスト埋め込みモデルは、多くのAIおよびNLP … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Interpretable Text Embeddings and Text Similarity Explanation: A Primer はコメントを受け付けていません