投稿者「jarxiv」のアーカイブ

NeoQA: Evidence-based Question Answering with Generated News Events

要約 ベンチマークがすぐに古くなる可能性があるため、大規模な言語モデル(LLMS … 続きを読む

カテゴリー: cs.CL | NeoQA: Evidence-based Question Answering with Generated News Events はコメントを受け付けていません

Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models

要約 子供の言語習得に触発されたインタラクティブな設定で言語モデルをトレーニング … 続きを読む

カテゴリー: cs.CL | Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models はコメントを受け付けていません

An Exploratory Analysis on the Explanatory Potential of Embedding-Based Measures of Semantic Transparency for Malay Word Recognition

要約 形態学的処理の研究により、意味認識にとって意味的な透明性が重要であることが … 続きを読む

カテゴリー: cs.CL | An Exploratory Analysis on the Explanatory Potential of Embedding-Based Measures of Semantic Transparency for Malay Word Recognition はコメントを受け付けていません

Exploring the Feasibility of Multilingual Grammatical Error Correction with a Single LLM up to 9B parameters: A Comparative Study of 17 Models

要約 最近の言語モデルは、さまざまな言語関連のタスクをうまく解決でき、多くの言語 … 続きを読む

カテゴリー: cs.CL | Exploring the Feasibility of Multilingual Grammatical Error Correction with a Single LLM up to 9B parameters: A Comparative Study of 17 Models はコメントを受け付けていません

Do Not Change Me: On Transferring Entities Without Modification in Neural Machine Translation — a Multilingual Perspective

要約 現在の機械翻訳モデルは、ほとんどのシナリオで高品質の出力を提供します。 た … 続きを読む

カテゴリー: cs.CL | Do Not Change Me: On Transferring Entities Without Modification in Neural Machine Translation — a Multilingual Perspective はコメントを受け付けていません

Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target Self-Distillation

要約 このペーパーでは、大規模な言語モデルで学習するための新しい自己設計方法であ … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target Self-Distillation はコメントを受け付けていません

Short-circuiting Shortcuts: Mechanistic Investigation of Shortcuts in Text Classification

要約 偽の相関(ショートカット)への依存は、言語モデルの多くの成功の根底にあるこ … 続きを読む

カテゴリー: cs.CL, cs.LG | Short-circuiting Shortcuts: Mechanistic Investigation of Shortcuts in Text Classification はコメントを受け付けていません

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

要約 大規模な言語モデル(LLM)が広くアクセスできるようになると、現実世界の使 … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG | Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information はコメントを受け付けていません

Attention on Multiword Expressions: A Multilingual Study of BERT-based Models with Regard to Idiomaticity and Microsyntax

要約 この研究では、BERTアーキテクチャ(BERTベースのモデル)に基づいた微 … 続きを読む

カテゴリー: cs.CL | Attention on Multiword Expressions: A Multilingual Study of BERT-based Models with Regard to Idiomaticity and Microsyntax はコメントを受け付けていません

ConvoGen: Enhancing Conversational AI with Synthetic Data: A Multi-Agent Approach

要約 この論文では、コンボゲン:マルチエージェントシステムを使用して合成会話デー … 続きを読む

カテゴリー: cs.CL | ConvoGen: Enhancing Conversational AI with Synthetic Data: A Multi-Agent Approach はコメントを受け付けていません