cs.CL」カテゴリーアーカイブ

Single Character Perturbations Break LLM Alignment

要約 LLMがデリケートで人間と接する場面で導入される場合、安全でない、偏った、 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Self-Evaluation as a Defense Against Adversarial Attacks on LLMs

要約 LLMがデリケートで人間と接する場面で導入される場合、安全でない、偏った、 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする

CATT: Character-based Arabic Tashkeel Transformer

要約 Tashkeel (Arabic Text Diacritization … 続きを読む

カテゴリー: cs.CL | コメントする

Protecting Privacy in Classifiers by Token Manipulation

要約 言語モデルをリモートサービスとして使用することは、信頼できないプロバイダー … 続きを読む

カテゴリー: cs.CL, cs.CR | コメントする

STF: Sentence Transformer Fine-Tuning For Topic Categorization With Limited Data

要約 今日、ツイートからのトピック分類は大きな注目を集めている。このような研究努 … 続きを読む

カテゴリー: cs.CL | コメントする

How Similar Are Elected Politicians and Their Constituents? Quantitative Evidence From Online Social Network

要約 政治家と投票する人々はどの程度似ているのだろうか?これは民主的代表制の根幹 … 続きを読む

カテゴリー: cs.CL, cs.SI | コメントする

Evaluating Automatic Metrics with Incremental Machine Translation Systems

要約 我々は、12の翻訳方向にわたって6年間にわたって毎週収集された商用機械翻訳 … 続きを読む

カテゴリー: cs.CL | コメントする

LLM Internal States Reveal Hallucination Risk Faced With a Query

要約 大規模言語モデル(LLM)の幻覚問題は、その信頼性と信用性を著しく制限する … 続きを読む

カテゴリー: cs.CL | コメントする

A Review of the Applications of Deep Learning-Based Emergent Communication

要約 創発的コミュニケーション、あるいは創発的言語は、人間の言語に似たコミュニケ … 続きを読む

カテゴリー: cs.CL, I.2.7 | コメントする

Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge

要約 脱獄攻撃は、Large Language Models(LLM)がセーフガ … 続きを読む

カテゴリー: cs.CL | コメントする