cs.CL」カテゴリーアーカイブ

The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context

要約 アライメントチューニングにより、大規模な言語モデルは推論、命令追従、有害な … 続きを読む

カテゴリー: cs.CL | The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context はコメントを受け付けていません

ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization

要約 近年の大規模言語モデル(LLM)の進歩により、人工知能の進歩が加速している … 続きを読む

カテゴリー: cs.CL | ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization はコメントを受け付けていません

Why do LLMs attend to the first token?

要約 大規模言語モデル(LLM)は、シーケンスの最初のトークンに集中する傾向があ … 続きを読む

カテゴリー: cs.CL | Why do LLMs attend to the first token? はコメントを受け付けていません

Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study

要約 大規模言語モデル(LLM)は入力の摂動に対して非常に脆弱である。LLMのロ … 続きを読む

カテゴリー: cs.CL | Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study はコメントを受け付けていません

Measuring Large Language Models Capacity to Annotate Journalistic Sourcing

要約 2022年後半にChatGPTが発表されて以来、大規模言語モデルの能力とそ … 続きを読む

カテゴリー: cs.CL, cs.CY | Measuring Large Language Models Capacity to Annotate Journalistic Sourcing はコメントを受け付けていません

MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs

要約 101の言語、6つの言語現象をカバーし、125,000以上のミニマルペアを … 続きを読む

カテゴリー: cs.CL | MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs はコメントを受け付けていません

A Framework for Robust Cognitive Evaluation of LLMs

要約 大規模言語モデル(LLM)における創発的な認知能力は広く観察されているが、 … 続きを読む

カテゴリー: cs.CL | A Framework for Robust Cognitive Evaluation of LLMs はコメントを受け付けていません

BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models

要約 予測モデルは、実世界のタスクにおいてしばしば不完全な情報を扱う必要がある。 … 続きを読む

カテゴリー: cs.CL | BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models はコメントを受け付けていません

A Survey of Large Language Models in Mental Health Disorder Detection on Social Media

要約 メンタルヘルス問題の検出と介入は、世界的に重要な研究テーマであり、ソーシャ … 続きを読む

カテゴリー: cs.CL, I.2.7 | A Survey of Large Language Models in Mental Health Disorder Detection on Social Media はコメントを受け付けていません

Measuring temporal effects of agent knowledge by date-controlled tool use

要約 知識の蓄積と更新には、時間的な進行が不可欠である。ウェブ検索はエージェント … 続きを読む

カテゴリー: cs.CL, cs.IR | Measuring temporal effects of agent knowledge by date-controlled tool use はコメントを受け付けていません