cs.CL」カテゴリーアーカイブ

Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models

要約 大規模言語モデル (LLM) の目覚ましい成功により、自然言語処理 (NL … 続きを読む

カテゴリー: cs.CL | Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models はコメントを受け付けていません

Enhancing Language Model Rationality with Bi-Directional Deliberation Reasoning

要約 この論文では、言語モデルの意思決定の合理性を強化する新しい推論アプローチで … 続きを読む

カテゴリー: cs.CL | Enhancing Language Model Rationality with Bi-Directional Deliberation Reasoning はコメントを受け付けていません

What’s Wrong with Your Code Generated by Large Language Models? An Extensive Study

要約 コード生成における大規模言語モデル (LLM) の開発の増加は、研究者の間 … 続きを読む

カテゴリー: cs.CL, cs.SE | What’s Wrong with Your Code Generated by Large Language Models? An Extensive Study はコメントを受け付けていません

SimPO: Simple Preference Optimization with a Reference-Free Reward

要約 Direct Preference Optimization (DPO) … 続きを読む

カテゴリー: cs.CL, cs.LG | SimPO: Simple Preference Optimization with a Reference-Free Reward はコメントを受け付けていません

LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages

要約 Large Language Model~(LLM) は、高リソース言語タ … 続きを読む

カテゴリー: cs.AI, cs.CL | LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages はコメントを受け付けていません

The Multilingual Alignment Prism: Aligning Global and Local Preferences to Reduce Harm

要約 「調整」の概念に関する主な懸念は、「何に対して調整するのか?」という暗黙の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Multilingual Alignment Prism: Aligning Global and Local Preferences to Reduce Harm はコメントを受け付けていません

Towards LLM-based Autograding for Short Textual Answers

要約 試験の採点は重要で、労力がかかり、主観的で反復的で、しばしば困難な作業です … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards LLM-based Autograding for Short Textual Answers はコメントを受け付けていません

Igea: a Decoder-Only Language Model for Biomedical Text Generation in Italian

要約 ドメイン固有の言語モデルの開発により、さまざまな専門分野、特に生物医学にお … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Igea: a Decoder-Only Language Model for Biomedical Text Generation in Italian はコメントを受け付けていません

Distilling System 2 into System 1

要約 大規模言語モデル (LLM) は、中間思考を生成するために推論中に余分な計 … 続きを読む

カテゴリー: cs.AI, cs.CL | Distilling System 2 into System 1 はコメントを受け付けていません

Variational Best-of-N Alignment

要約 Best-of-N (BoN) は、言語モデルを人間の好みに合わせるための … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Variational Best-of-N Alignment はコメントを受け付けていません