cs.CL」カテゴリーアーカイブ

The interplay between domain specialization and model size

要約 言語モデルのスケーリング法則は、多くの場合、ゼロからトレーニングのために最 … 続きを読む

カテゴリー: cs.AI, cs.CL | The interplay between domain specialization and model size はコメントを受け付けていません

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

要約 大規模な言語モデル(LLM)は、しばしば誤った知識または時代遅れの知識のた … 続きを読む

カテゴリー: cs.AI, cs.CL | AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models はコメントを受け付けていません

SynSUM — Synthetic Benchmark with Structured and Unstructured Medical Records

要約 構造化されたバックグラウンド変数に非構造化された臨床ノートをリンクする合成 … 続きを読む

カテゴリー: cs.AI, cs.CL | SynSUM — Synthetic Benchmark with Structured and Unstructured Medical Records はコメントを受け付けていません

Quantifying the Robustness of Retrieval-Augmented Language Models Against Spurious Features in Grounding Data

要約 堅牢性は、実際のアプリケーションでRAGシステムを展開するための重要な属性 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Quantifying the Robustness of Retrieval-Augmented Language Models Against Spurious Features in Grounding Data はコメントを受け付けていません

R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning

要約 既存の大規模な推論モデル(LRMS)は、大規模な言語モデルの複雑な推論能力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning はコメントを受け付けていません

A Survey on Sparse Autoencoders: Interpreting the Internal Mechanisms of Large Language Models

要約 大規模な言語モデル(LLM)は自然言語処理に革命をもたらしましたが、その内 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Survey on Sparse Autoencoders: Interpreting the Internal Mechanisms of Large Language Models はコメントを受け付けていません

Learning LLM Preference over Intra-Dialogue Pairs: A Framework for Utterance-level Understandings

要約 大規模な言語モデル(LLM)は、ユースケース固有の微調整を必要とせずに、複 … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning LLM Preference over Intra-Dialogue Pairs: A Framework for Utterance-level Understandings はコメントを受け付けていません

DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference

要約 大規模な言語モデル(LLMS)は、少数のショットプロンプト、マルチステップ … 続きを読む

カテゴリー: cs.AI, cs.CL | DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference はコメントを受け付けていません

Symbolic Mixture-of-Experts: Adaptive Skill-based Routing for Heterogeneous Reasoning

要約 既存の事前に訓練された専門家LLMSを組み合わせることは、大規模で多様なタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Symbolic Mixture-of-Experts: Adaptive Skill-based Routing for Heterogeneous Reasoning はコメントを受け付けていません

Pi-GPS: Enhancing Geometry Problem Solving by Unleashing the Power of Diagrammatic Information

要約 ジオメトリの問題解決は、インテリジェントな教育分野での潜在的なアプリケーシ … 続きを読む

カテゴリー: cs.CL, cs.CV | Pi-GPS: Enhancing Geometry Problem Solving by Unleashing the Power of Diagrammatic Information はコメントを受け付けていません