月別アーカイブ: 2025年4月

LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems

要約 フェルミ問題(FP)は、人間のような論理と数値推論を必要とする数学的推論課 … 続きを読む

カテゴリー: cs.CL | コメントする

Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole

要約 ギニアビサウ・クレオール語(Kiriol)の機械翻訳のための新しいデータセ … 続きを読む

カテゴリー: cs.CL | コメントする

The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context

要約 アライメントチューニングにより、大規模な言語モデルは推論、命令追従、有害な … 続きを読む

カテゴリー: cs.CL | コメントする

ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization

要約 近年の大規模言語モデル(LLM)の進歩により、人工知能の進歩が加速している … 続きを読む

カテゴリー: cs.CL | コメントする

Why do LLMs attend to the first token?

要約 大規模言語モデル(LLM)は、シーケンスの最初のトークンに集中する傾向があ … 続きを読む

カテゴリー: cs.CL | コメントする

Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study

要約 大規模言語モデル(LLM)は入力の摂動に対して非常に脆弱である。LLMのロ … 続きを読む

カテゴリー: cs.CL | コメントする

Measuring Large Language Models Capacity to Annotate Journalistic Sourcing

要約 2022年後半にChatGPTが発表されて以来、大規模言語モデルの能力とそ … 続きを読む

カテゴリー: cs.CL, cs.CY | コメントする

MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs

要約 101の言語、6つの言語現象をカバーし、125,000以上のミニマルペアを … 続きを読む

カテゴリー: cs.CL | コメントする

A Framework for Robust Cognitive Evaluation of LLMs

要約 大規模言語モデル(LLM)における創発的な認知能力は広く観察されているが、 … 続きを読む

カテゴリー: cs.CL | コメントする

BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models

要約 予測モデルは、実世界のタスクにおいてしばしば不完全な情報を扱う必要がある。 … 続きを読む

カテゴリー: cs.CL | コメントする