「cs.CL」カテゴリーアーカイブ

WorldPM: Scaling Human Preference Modeling

投稿日: 2025年5月16日作成者: jarxiv

要約モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

投稿日: 2025年5月16日作成者: jarxiv

要約大規模な推論モデル（LRMS）は、既に長い考え方の推論のために潜在能力を持 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

How Does Knowledge Selection Help Retrieval Augmented Generation?

投稿日: 2025年5月16日作成者: jarxiv

要約検索された生成（RAG）は、外部の知識をモデルの出力に統合することにより、 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models

投稿日: 2025年5月16日作成者: jarxiv

要約トランスベースの大規模な事前訓練モデルは、大きな成功を収めています。微調 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Rethinking Repetition Problems of LLMs in Code Generation

投稿日: 2025年5月16日作成者: jarxiv

要約神経言語モデルの出現により、コード生成のパフォーマンスが大幅に向上しました … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントを受け付けていません

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization

投稿日: 2025年5月16日作成者: jarxiv

要約大規模な言語モデル（LLM）は、言語の理解と生成に顕著な能力を示しています … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Superposition Yields Robust Neural Scaling

投稿日: 2025年5月16日作成者: jarxiv

要約今日の大規模な言語モデル（LLMS）の成功は、より大きなモデルのパフォーマ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction

投稿日: 2025年5月16日作成者: jarxiv

要約この研究では、スプリットコンフォーマル予測（SCP）フレームワークを介した … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Benchmarking Generative AI for Scoring Medical Student Interviews in Objective Structured Clinical Examinations (OSCEs)

投稿日: 2025年5月16日作成者: jarxiv

要約客観的な構造化された臨床検査（OSCES）は、医学生のコミュニケーションス … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling

投稿日: 2025年5月16日作成者: jarxiv

要約この研究では、大規模な言語モデル（LLM）内の注意に基づいた情報の流れが、 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

WorldPM: Scaling Human Preference Modeling

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

How Does Knowledge Selection Help Retrieval Augmented Generation?

Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models

Rethinking Repetition Problems of LLMs in Code Generation

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization

Superposition Yields Robust Neural Scaling

Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction

Benchmarking Generative AI for Scoring Medical Student Interviews in Objective Structured Clinical Examinations (OSCEs)

PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling

最近の投稿

最近のコメント

アーカイブ

カテゴリー