月別アーカイブ: 2025年4月

ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations

要約 アカデミックライティングでは、首尾一貫したテキスト生成と関連文献の正確な引 … 続きを読む

カテゴリー: cs.CL | ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations はコメントを受け付けていません

LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems

要約 フェルミ問題(FP)は、人間のような論理と数値推論を必要とする数学的推論課 … 続きを読む

カテゴリー: cs.CL | LLM for Complex Reasoning Task: An Exploratory Study in Fermi Problems はコメントを受け付けていません

Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole

要約 ギニアビサウ・クレオール語(Kiriol)の機械翻訳のための新しいデータセ … 続きを読む

カテゴリー: cs.CL | Limitations of Religious Data and the Importance of the Target Domain: Towards Machine Translation for Guinea-Bissau Creole はコメントを受け付けていません

The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context

要約 アライメントチューニングにより、大規模な言語モデルは推論、命令追従、有害な … 続きを読む

カテゴリー: cs.CL | The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual context はコメントを受け付けていません

ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization

要約 近年の大規模言語モデル(LLM)の進歩により、人工知能の進歩が加速している … 続きを読む

カテゴリー: cs.CL | ERPO: Advancing Safety Alignment via Ex-Ante Reasoning Preference Optimization はコメントを受け付けていません

Why do LLMs attend to the first token?

要約 大規模言語モデル(LLM)は、シーケンスの最初のトークンに集中する傾向があ … 続きを読む

カテゴリー: cs.CL | Why do LLMs attend to the first token? はコメントを受け付けていません

Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study

要約 大規模言語モデル(LLM)は入力の摂動に対して非常に脆弱である。LLMのロ … 続きを読む

カテゴリー: cs.CL | Enhancing LLM Robustness to Perturbed Instructions: An Empirical Study はコメントを受け付けていません

Measuring Large Language Models Capacity to Annotate Journalistic Sourcing

要約 2022年後半にChatGPTが発表されて以来、大規模言語モデルの能力とそ … 続きを読む

カテゴリー: cs.CL, cs.CY | Measuring Large Language Models Capacity to Annotate Journalistic Sourcing はコメントを受け付けていません

MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs

要約 101の言語、6つの言語現象をカバーし、125,000以上のミニマルペアを … 続きを読む

カテゴリー: cs.CL | MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs はコメントを受け付けていません

A Framework for Robust Cognitive Evaluation of LLMs

要約 大規模言語モデル(LLM)における創発的な認知能力は広く観察されているが、 … 続きを読む

カテゴリー: cs.CL | A Framework for Robust Cognitive Evaluation of LLMs はコメントを受け付けていません