投稿者「jarxiv」のアーカイブ

Hate Personified: Investigating the role of LLMs in content moderation

要約 ヘイト検出のような主観的なタスクでは、人によってヘイトの捉え方が異なるため … 続きを読む

カテゴリー: cs.CL, cs.CY | コメントする

How to Train Long-Context Language Models (Effectively)

要約 我々は、ロングコンテクスト情報を効果的に利用するための言語モデル(LM)の … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

On Leakage of Code Generation Evaluation Datasets

要約 本論文では、コード生成テストセットによる汚染、特に最新の大規模言語モデルで … 続きを読む

カテゴリー: cs.CL | コメントする

Examining Language Modeling Assumptions Using an Annotated Literary Dialect Corpus

要約 19世紀アメリカ文学の正書法変化トークンのデータセットと、人間による注釈が … 続きを読む

カテゴリー: cs.CL | コメントする

StorySparkQA: Expert-Annotated QA Pairs with Real-World Knowledge for Children’s Story-Based Learning

要約 インタラクティブな絵本の読み聞かせは、一般的な親子活動であり、親は、絵本の … 続きを読む

カテゴリー: cs.CL | コメントする

Jailbreaking LLMs with Arabic Transliteration and Arabizi

要約 本研究では、「脱獄」攻撃に対する大規模言語モデル(LLM)の潜在的な脆弱性 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

HiddenGuard: Fine-Grained Safe Generation with Specialized Representation Router

要約 大規模言語モデル(LLM)がますます強力になるにつれて、その安全性と人間の … 続きを読む

カテゴリー: cs.CL | コメントする

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Enhanced Automated Code Vulnerability Repair using Large Language Models

要約 この研究は、テクノロジー主導の世界においてデジタル・セキュリティを強化する … 続きを読む

カテゴリー: cs.CL, cs.SE | コメントする

On the Proper Treatment of Tokenization in Psycholinguistics

要約 言語モデルは、計算心理言語学において、ある言語モデルにおける注目領域(文字 … 続きを読む

カテゴリー: cs.CL | コメントする