cs.CL」カテゴリーアーカイブ

Alleviating Hallucinations in Large Language Models with Scepticism Modeling

要約 幻覚は大規模言語モデル (LLM) にとって大きな課題であり、さまざまな分 … 続きを読む

カテゴリー: cs.CL, cs.LG | Alleviating Hallucinations in Large Language Models with Scepticism Modeling はコメントを受け付けていません

Exploring Italian sentence embeddings properties through multi-tasking

要約 マルチタスク設定において、既存の LLM がイタリア語の抽象言語情報をどの … 続きを読む

カテゴリー: 68T50, cs.CL, I.2.7 | Exploring Italian sentence embeddings properties through multi-tasking はコメントを受け付けていません

TeXBLEU: Automatic Metric for Evaluate LaTeX Format

要約 LaTeX は、特に科学、技術、数学、コンピューター サイエンスの分野で、 … 続きを読む

カテゴリー: cs.CL | TeXBLEU: Automatic Metric for Evaluate LaTeX Format はコメントを受け付けていません

Sortformer: Seamless Integration of Speaker Diarization and ASR by Bridging Timestamps and Tokens

要約 私たちは、既存のエンドツーエンドのダイアライゼーション モデルと比較して型 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Sortformer: Seamless Integration of Speaker Diarization and ASR by Bridging Timestamps and Tokens はコメントを受け付けていません

SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models

要約 大規模言語モデル (LLM) の急速な進歩には、そのパラメーター サイズの … 続きを読む

カテゴリー: cs.CL, cs.LG | SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models はコメントを受け付けていません

Mitigating the Influence of Distractor Tasks in LMs with Prior-Aware Decoding

要約 言語モデル (LM) の広範な機能は、気を散らすタスクに対する感度によって … 続きを読む

カテゴリー: cs.CL | Mitigating the Influence of Distractor Tasks in LMs with Prior-Aware Decoding はコメントを受け付けていません

E2LLM: Encoder Elongated Large Language Models for Long-Context Understanding and Reasoning

要約 大規模言語モデル (LLM) の領域では、複数ラウンドの対話、コード生成、 … 続きを読む

カテゴリー: cs.CL | E2LLM: Encoder Elongated Large Language Models for Long-Context Understanding and Reasoning はコメントを受け付けていません

QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval

要約 多くの場合、情報検索 (IR) システムのユーザーは、包括的な情報ニーズ … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval はコメントを受け付けていません

HexaCoder: Secure Code Generation via Oracle-Guided Synthetic Training Data

要約 大規模言語モデル (LLM) は、自動コード生成の大きな可能性を示しており … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, cs.SE | HexaCoder: Secure Code Generation via Oracle-Guided Synthetic Training Data はコメントを受け付けていません

An Effective Context-Balanced Adaptation Approach for Long-Tailed Speech Recognition

要約 エンドツーエンド (E2E) 自動音声認識 (ASR) モデルは、さまざま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | An Effective Context-Balanced Adaptation Approach for Long-Tailed Speech Recognition はコメントを受け付けていません