月別アーカイブ: 2025年2月

Mind the Gap: Examining the Self-Improvement Capabilities of Large Language Models

要約 自己改善は、トレーニング前、トレーニング後、テスト時間推論の大規模な言語モ … 続きを読む

カテゴリー: cs.CL, cs.LG | Mind the Gap: Examining the Self-Improvement Capabilities of Large Language Models はコメントを受け付けていません

Historical German Text Normalization Using Type- and Token-Based Language Modeling

要約 スペルの歴史的なバリエーションは、歴史的なデジタル化されたテキストでのフル … 続きを読む

カテゴリー: cs.CL | Historical German Text Normalization Using Type- and Token-Based Language Modeling はコメントを受け付けていません

How Does Code Pretraining Affect Language Model Task Performance?

要約 大規模な言語モデルは、自然言語とソースコードなどの非言語データの両方を含む … 続きを読む

カテゴリー: cs.CL, cs.LG | How Does Code Pretraining Affect Language Model Task Performance? はコメントを受け付けていません

Monte Carlo Temperature: a robust sampling strategy for LLM’s uncertainty quantification methods

要約 大規模な言語モデル(LLMS)の不確実性の定量化(UQ)は、特に誤った出力 … 続きを読む

カテゴリー: cs.CL | Monte Carlo Temperature: a robust sampling strategy for LLM’s uncertainty quantification methods はコメントを受け付けていません

KiRAG: Knowledge-Driven Iterative Retriever for Enhancing Retrieval-Augmented Generation

要約 反復的な検索上位生成(IRAG)モデルは、マルチホップ質問応答(QA)に効 … 続きを読む

カテゴリー: cs.CL | KiRAG: Knowledge-Driven Iterative Retriever for Enhancing Retrieval-Augmented Generation はコメントを受け付けていません

Queue management for slo-oriented large language model serving

要約 大規模な言語モデル(LLM)は、クラウドプロバイダーにとってますます重要な … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Queue management for slo-oriented large language model serving はコメントを受け付けていません

GLEAN: Generalized Category Discovery with Diverse and Quality-Enhanced LLM Feedback

要約 一般化されたカテゴリ発見(GCD)は、既知のカテゴリからの限定されたラベル … 続きを読む

カテゴリー: cs.CL, cs.LG | GLEAN: Generalized Category Discovery with Diverse and Quality-Enhanced LLM Feedback はコメントを受け付けていません

Accelerating Unbiased LLM Evaluation via Synthetic Feedback

要約 新しい大手言語モデル(LLMS)を開発する場合、重要なステップは、多くの場 … 続きを読む

カテゴリー: cs.CL, cs.LG | Accelerating Unbiased LLM Evaluation via Synthetic Feedback はコメントを受け付けていません

Rank1: Test-Time Compute for Reranking in Information Retrieval

要約 テスト時間計算を活用するために訓練された最初の再ランキングモデルであるRA … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | Rank1: Test-Time Compute for Reranking in Information Retrieval はコメントを受け付けていません

Compressing Language Models for Specialized Domains

要約 剪定や量子化などの圧縮技術は、ベンチマークパフォーマンスのパフォーマンスが … 続きを読む

カテゴリー: cs.CL | Compressing Language Models for Specialized Domains はコメントを受け付けていません