cs.CL」カテゴリーアーカイブ

WorldPM: Scaling Human Preference Modeling

要約 モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む

カテゴリー: cs.CL | WorldPM: Scaling Human Preference Modeling はコメントを受け付けていません

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

要約 大規模な推論モデル(LRMS)は、既に長い考え方の推論のために潜在能力を持 … 続きを読む

カテゴリー: cs.CL | Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models はコメントを受け付けていません

How Does Knowledge Selection Help Retrieval Augmented Generation?

要約 検索された生成(RAG)は、外部の知識をモデルの出力に統合することにより、 … 続きを読む

カテゴリー: cs.CL | How Does Knowledge Selection Help Retrieval Augmented Generation? はコメントを受け付けていません

Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models

要約 トランスベースの大規模な事前訓練モデルは、大きな成功を収めています。 微調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models はコメントを受け付けていません

Rethinking Repetition Problems of LLMs in Code Generation

要約 神経言語モデルの出現により、コード生成のパフォーマンスが大幅に向上しました … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | Rethinking Repetition Problems of LLMs in Code Generation はコメントを受け付けていません

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization

要約 大規模な言語モデル(LLM)は、言語の理解と生成に顕著な能力を示しています … 続きを読む

カテゴリー: cs.AI, cs.CL | Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization はコメントを受け付けていません

Superposition Yields Robust Neural Scaling

要約 今日の大規模な言語モデル(LLMS)の成功は、より大きなモデルのパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Superposition Yields Robust Neural Scaling はコメントを受け付けていません

Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction

要約 この研究では、スプリットコンフォーマル予測(SCP)フレームワークを介した … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction はコメントを受け付けていません

Benchmarking Generative AI for Scoring Medical Student Interviews in Objective Structured Clinical Examinations (OSCEs)

要約 客観的な構造化された臨床検査(OSCES)は、医学生のコミュニケーションス … 続きを読む

カテゴリー: cs.AI, cs.CL | Benchmarking Generative AI for Scoring Medical Student Interviews in Objective Structured Clinical Examinations (OSCEs) はコメントを受け付けていません

PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling

要約 この研究では、大規模な言語モデル(LLM)内の注意に基づいた情報の流れが、 … 続きを読む

カテゴリー: cs.AI, cs.CL | PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling はコメントを受け付けていません