cs.CL」カテゴリーアーカイブ

Gaussian mixture models as a proxy for interacting language models

要約 大規模言語モデル(LLM)は、多くの場面で人間の能力や行動と一致する能力を … 続きを読む

カテゴリー: 62R07, cs.CL, cs.LG, stat.ML | Gaussian mixture models as a proxy for interacting language models はコメントを受け付けていません

Unmasking Database Vulnerabilities: Zero-Knowledge Schema Inference Attacks in Text-to-SQL Systems

要約 Text-to-SQL システムは、クエリを実行可能な SQL コードに自 … 続きを読む

カテゴリー: cs.CL | Unmasking Database Vulnerabilities: Zero-Knowledge Schema Inference Attacks in Text-to-SQL Systems はコメントを受け付けていません

Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios?

要約 近年の自然言語処理における目覚ましい改善は、主に文脈ニューラル言語モデルの … 続きを読む

カテゴリー: cs.CL, cs.LG | Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios? はコメントを受け付けていません

Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective

要約 強化学習(RL)は、複雑な長鎖思考(long-CoT)推論において大規模言 … 続きを読む

カテゴリー: cs.CL | Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective はコメントを受け付けていません

On the class of coding optimality of human languages and the origins of Zipf’s law

要約 ここでは、符号化システムの最適性に関する新しいクラスを提示する。そのクラス … 続きを読む

カテゴリー: cs.CL, physics.soc-ph | On the class of coding optimality of human languages and the origins of Zipf’s law はコメントを受け付けていません

d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning

要約 最近の大規模言語モデル(LLM)は、オンライン強化学習(RL)の恩恵を受け … 続きを読む

カテゴリー: cs.CL, cs.LG | d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning はコメントを受け付けていません

A$^2$ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization

要約 長いコンテキストの大規模言語モデル(LLM)は、KVキャッシュの大きなメモ … 続きを読む

カテゴリー: cs.CL | A$^2$ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization はコメントを受け付けていません

Literary Evidence Retrieval via Long-Context Language Models

要約 現代のロングコンテクスト言語モデルは、文学的フィクションをどの程度理解して … 続きを読む

カテゴリー: cs.CL | Literary Evidence Retrieval via Long-Context Language Models はコメントを受け付けていません

Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human?

要約 文法誤り訂正(GEC)における自動評価メトリクスの目標の1つは、人間の嗜好 … 続きを読む

カテゴリー: cs.CL | Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human? はコメントを受け付けていません

Beyond Text Compression: Evaluating Tokenizers Across Scales

要約 トークナイザーの選択は言語モデルの性能に大きな影響を与えるが、トークナイザ … 続きを読む

カテゴリー: cs.CL | Beyond Text Compression: Evaluating Tokenizers Across Scales はコメントを受け付けていません