投稿者「jarxiv」のアーカイブ

Large Language Model-Driven Dynamic Assessment of Grammatical Accuracy in English Language Learner Writing

要約 本研究では、大規模言語モデル(LLM)による動的評価(DA)のスケールアッ … 続きを読む

カテゴリー: cs.AI, cs.CL | Large Language Model-Driven Dynamic Assessment of Grammatical Accuracy in English Language Learner Writing はコメントを受け付けていません

Llama-Nemotron: Efficient Reasoning Models

要約 Llama-Nemotronシリーズは、卓越した推論能力、推論効率、オープ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Llama-Nemotron: Efficient Reasoning Models はコメントを受け付けていません

Dynamics of Spontaneous Topic Changes in Next Token Prediction with Self-Attention

要約 人間の認知は、感情的、文脈的、または連想的な手がかりによって引き起こされる … 続きを読む

カテゴリー: cs.AI, cs.CL, stat.ML | Dynamics of Spontaneous Topic Changes in Next Token Prediction with Self-Attention はコメントを受け付けていません

Attack and defense techniques in large language models: A survey and new perspectives

要約 大規模言語モデル(LLM)は、多くの自然言語処理タスクの中心的存在となって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Attack and defense techniques in large language models: A survey and new perspectives はコメントを受け付けていません

A Character-based Diffusion Embedding Algorithm for Enhancing the Generation Quality of Generative Linguistic Steganographic Texts

要約 高品質のステガノグラフィテキストを生成することは、生成的言語ステガノグラフ … 続きを読む

カテゴリー: cs.CL, cs.CR | A Character-based Diffusion Embedding Algorithm for Enhancing the Generation Quality of Generative Linguistic Steganographic Texts はコメントを受け付けていません

Synthesize-on-Graph: Knowledgeable Synthetic Data Generation for Continue Pre-training of Large Language Models

要約 大規模言語モデル(LLM)は目覚ましい成功を収めたが、特に限られた独自のデ … 続きを読む

カテゴリー: cs.AI, cs.CL | Synthesize-on-Graph: Knowledgeable Synthetic Data Generation for Continue Pre-training of Large Language Models はコメントを受け付けていません

Position: Enough of Scaling LLMs! Lets Focus on Downscaling

要約 我々は、ニューラル・スケーリング法則への支配的な焦点に異議を唱え、大規模言 … 続きを読む

カテゴリー: cs.CL | Position: Enough of Scaling LLMs! Lets Focus on Downscaling はコメントを受け付けていません

Does Self-Attention Need Separate Weights in Transformers?

要約 自己注意の成功は、長距離の依存関係を捉え、文脈理解を強化する能力にあるが、 … 続きを読む

カテゴリー: cs.CL | Does Self-Attention Need Separate Weights in Transformers? はコメントを受け付けていません

VTS-LLM: Domain-Adaptive LLM Agent for Enhancing Awareness in Vessel Traffic Services through Natural Language

要約 船舶交通サービス(VTS)は、リアルタイムの交通管理を通じて、海上の安全と … 続きを読む

カテゴリー: cs.CL | VTS-LLM: Domain-Adaptive LLM Agent for Enhancing Awareness in Vessel Traffic Services through Natural Language はコメントを受け付けていません

Token-free Models for Sarcasm Detection

要約 トークン化は、ほとんどの自然言語処理(NLP)パイプラインにおける基本的な … 続きを読む

カテゴリー: cs.CL | Token-free Models for Sarcasm Detection はコメントを受け付けていません