cs.CL」カテゴリーアーカイブ

Kinetics: Rethinking Test-Time Scaling Laws

要約 実用的な効率の観点からテスト時間のスケーリング法則を再考し、小さなモデルの … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Search Arena: Analyzing Search-Augmented LLMs

要約 検索の高地言語モデルは、Web検索と大規模な言語モデル(LLMS)を組み合 … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | コメントする

Flattery, Fluff, and Fog: Diagnosing and Mitigating Idiosyncratic Biases in Preference Models

要約 言語モデルは、整合性と評価における人間の好みの判断のプロキシとして機能しま … 続きを読む

カテゴリー: cs.CL | コメントする

Why LLM Safety Guardrails Collapse After Fine-tuning: A Similarity Analysis Between Alignment and Fine-tuning Datasets

要約 大規模な言語モデル(LLMS)の最近の進歩は、特に下流の微調整を受けた場合 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする

Inference-Time Hyper-Scaling with KV Cache Compression

要約 より長い並列シーケンスを生成することにより、推論時のスケーリング取引効率を … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Does It Make Sense to Speak of Introspection in Large Language Models?

要約 大規模な言語モデル(LLM)は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

GoRA: Gradient-driven Adaptive Low Rank Adaptation

要約 低ランク適応(LORA)は、ランクの選択と重量の初期化という2つの重要な要 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Leveraging LLMs for Bangla Grammar Error Correction:Error Categorization, Synthetic Data, and Model Evaluation

要約 大規模な言語モデル(LLM)は、英語を含む多くの言語で自然言語理解(NLU … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

LLM Social Simulations Are a Promising Research Method

要約 人間の研究対象の正確で検証可能な大手言語モデル(LLM)シミュレーションは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC | コメントする

DiCoRe: Enhancing Zero-shot Event Detection via Divergent-Convergent LLM Reasoning

要約 ゼロショットイベント検出(ED)、トレーニングデータなしで自然言語テキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする