cs.CL」カテゴリーアーカイブ

Training Bilingual LMs with Data Constraints in the Targeted Language

要約 大規模な言語モデルは、現在のスケーリング法の要求に従って、Web の大規模 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers

要約 大規模な言語モデルの計算の複雑さを軽減するために、リニア アテンションやフ … 続きを読む

カテゴリー: cs.CL | コメントする

LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts

要約 大規模言語モデル (LLM) は複雑なタスクで優れたパフォーマンスを示しま … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Breaking the Cycle of Recurring Failures: Applying Generative AI to Root Cause Analysis in Legacy Banking Systems

要約 従来の銀行は、主にレガシー システムの制約と所有権の断片化により、デジタル … 続きを読む

カテゴリー: cs.CL, cs.SE | コメントする

Rich Semantic Knowledge Enhanced Large Language Models for Few-shot Chinese Spell Checking

要約 中国語のスペル チェック (CSC) は広く使用されているテクノロジであり … 続きを読む

カテゴリー: cs.CL | コメントする

Explainable LLM-driven Multi-dimensional Distillation for E-Commerce Relevance Learning

要約 効果的なクエリ項目関連性モデリングは、電子商取引検索システムにおけるユーザ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | コメントする

Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph Construction

要約 この論文では、ナレッジ グラフ構築 (KGC) における大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models

要約 この論文では、新しい PEFT 手法である特異値と正規直交正則特異ベクトル … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Patience Is The Key to Large Language Model Reasoning

要約 大規模言語モデルの分野における最近の進歩、特に思考連鎖 (CoT) アプロ … 続きを読む

カテゴリー: cs.CL | コメントする

SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Search for Enhanced Code Generation

要約 大規模な言語モデルは、単純なコード生成タスクでは優れたパフォーマンスを示し … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする