投稿者「jarxiv」のアーカイブ

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

要約 大規模な言語モデルでは検索拡張生成が普及するにつれて、埋め込みモデルの重要 … 続きを読む

カテゴリー: cs.CL | コメントする

OpenCSG Chinese Corpus: A Series of High-quality Chinese Datasets for LLM Training

要約 大規模言語モデル (LLM) は顕著な機能を実証していますが、その成功は事 … 続きを読む

カテゴリー: cs.CL | コメントする

CWEval: Outcome-driven Evaluation on Functionality and Security of LLM Code Generation

要約 大規模言語モデル (LLM) は、コード作成を生成または支援することで開発 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | コメントする

Personalized LLM Response Generation with Parameterized Memory Injection

要約 大規模言語モデル (LLM) は、自然言語の理解と生成において顕著な熟練度 … 続きを読む

カテゴリー: cs.CL | コメントする

ArithmAttack: Evaluating Robustness of LLMs to Noisy Context in Math Problem Solving

要約 大規模言語モデル (LLM) は数学の問題解決タスクにおいて優れた能力を示 … 続きを読む

カテゴリー: cs.CL | コメントする

Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination

要約 この記事では、スペイン語と英語の大学入学レベル試験の多肢選択問題 1003 … 続きを読む

カテゴリー: cs.CL | コメントする

Exploring Robustness of LLMs to Sociodemographically-Conditioned Paraphrasing

要約 大規模言語モデル (LLM) は、さまざまな NLP タスクで優れたパフォ … 続きを読む

カテゴリー: cs.CL | コメントする

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

要約 ヘイトスピーチや暴言は世界的な現象であり、理解、特定、緩和するには社会文化 … 続きを読む

カテゴリー: cs.CL | コメントする

A Survey on Pedophile Attribution Techniques for Online Platforms

要約 ソーシャル メディアの匿名性への依存により、これらのプラットフォームではあ … 続きを読む

カテゴリー: A.1, cs.CL, I.7.5 | コメントする

Everybody Likes to Sleep: A Computer-Assisted Comparison of Object Naming Data from 30 Languages

要約 オブジェクトのネーミング (単語やフレーズでオブジェクトを識別する行為) … 続きを読む

カテゴリー: cs.CL | コメントする