cs.CL」カテゴリーアーカイブ

RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs

要約 このペーパーでは、実際のユーザーインタラクションデータが利用できない場合、 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Disentangling Memory and Reasoning Ability in Large Language Models

要約 大規模な言語モデル(LLMS)は、広範な知識と推論能力の両方を必要とする複 … 続きを読む

カテゴリー: cs.CL | コメントする

The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks

要約 翻訳トレインなど、翻訳を横断する転送XLTのための翻訳ベースの戦略 &#8 … 続きを読む

カテゴリー: cs.CL | コメントする

WorldPM: Scaling Human Preference Modeling

要約 モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む

カテゴリー: cs.CL | コメントする

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

要約 大規模な推論モデル(LRMS)は、既に長い考え方の推論のために潜在能力を持 … 続きを読む

カテゴリー: cs.CL | コメントする

How Does Knowledge Selection Help Retrieval Augmented Generation?

要約 検索された生成(RAG)は、外部の知識をモデルの出力に統合することにより、 … 続きを読む

カテゴリー: cs.CL | コメントする

Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models

要約 トランスベースの大規模な事前訓練モデルは、大きな成功を収めています。 微調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Rethinking Repetition Problems of LLMs in Code Generation

要約 神経言語モデルの出現により、コード生成のパフォーマンスが大幅に向上しました … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントする

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization

要約 大規模な言語モデル(LLM)は、言語の理解と生成に顕著な能力を示しています … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Superposition Yields Robust Neural Scaling

要約 今日の大規模な言語モデル(LLMS)の成功は、より大きなモデルのパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする