cs.CL」カテゴリーアーカイブ

CASTILLO: Characterizing Response Length Distributions of Large Language Models

要約 大規模な言語モデル(LLM)推論のコンピューテリソースを効率的に管理するこ … 続きを読む

カテゴリー: cs.AI, cs.CL | CASTILLO: Characterizing Response Length Distributions of Large Language Models はコメントを受け付けていません

Don’t ‘Overthink’ Passage Reranking: Is Reasoning Truly Necessary?

要約 複雑な自然言語のタスクにわたる推論モデルの成功により、情報検索(IR)コミ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Don’t ‘Overthink’ Passage Reranking: Is Reasoning Truly Necessary? はコメントを受け付けていません

CAIN: Hijacking LLM-Humans Conversations via a Two-Stage Malicious System Prompt Generation and Refining Framework

要約 大規模な言語モデル(LLM)は多くのアプリケーションを進めてきましたが、敵 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | CAIN: Hijacking LLM-Humans Conversations via a Two-Stage Malicious System Prompt Generation and Refining Framework はコメントを受け付けていません

Slamming: Training a Speech Language Model on One GPU in a Day

要約 24時間で単一のアカデミックGPUで高品質の音声言語モデル(SLM)をトレ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Slamming: Training a Speech Language Model on One GPU in a Day はコメントを受け付けていません

Latent Principle Discovery for Language Model Self-Improvement

要約 言語モデル(LM)ユーザーが世代の品質を向上させることを目指している場合、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Latent Principle Discovery for Language Model Self-Improvement はコメントを受け付けていません

The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm

要約 極性分解と関連するマトリックス記号関数を計算することは、数十年にわたって数 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NA, math.NA, math.OC | The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm はコメントを受け付けていません

Vague Knowledge: Evidence from Analyst Reports

要約 現実の世界の人々は、しばしば将来の見返りに関するあいまいな知識を持っていま … 続きを読む

カテゴリー: (Primary), 03B48, 03B65, 03E02, 03E15, 03E72, 18E45, 28A05, 62F15, 68T01, 68T35, 68T50, 91G30, cs.AI, cs.CL, econ.GN, I.2.3, math.LO, q-fin.EC, q-fin.GN | Vague Knowledge: Evidence from Analyst Reports はコメントを受け付けていません

AGENTIF: Benchmarking Instruction Following of Large Language Models in Agentic Scenarios

要約 大規模な言語モデル(LLMS)は、実際のエージェントアプリケーションで高度 … 続きを読む

カテゴリー: cs.AI, cs.CL | AGENTIF: Benchmarking Instruction Following of Large Language Models in Agentic Scenarios はコメントを受け付けていません

BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation

要約 文の意味的な意味に基づくテキストセグメンテーションは、多くのダウンストリー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation はコメントを受け付けていません

Fixing Data That Hurts Performance: Cascading LLMs to Relabel Hard Negatives for Robust Information Retrieval

要約 トレーニング堅牢な検索および再生モデルは、通常、大規模な検索データセットに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Fixing Data That Hurts Performance: Cascading LLMs to Relabel Hard Negatives for Robust Information Retrieval はコメントを受け付けていません