cs.CL」カテゴリーアーカイブ

Checkpoint Merging via Bayesian Optimization in LLM Pretraining

要約 GPT-4 や Gemini などの大規模言語モデル (LLM) の急速な … 続きを読む

カテゴリー: cs.CL | Checkpoint Merging via Bayesian Optimization in LLM Pretraining はコメントを受け付けていません

KazParC: Kazakh Parallel Corpus for Machine Translation

要約 カザフ語、英語、ロシア語、トルコ語の機械翻訳用に設計された対訳コーパスであ … 続きを読む

カテゴリー: cs.CL | KazParC: Kazakh Parallel Corpus for Machine Translation はコメントを受け付けていません

BP4ER: Bootstrap Prompting for Explicit Reasoning in Medical Dialogue Generation

要約 医療対話生成 (MDG) は、その実用的な価値が非常に高いため、ますます注 … 続きを読む

カテゴリー: cs.CL | BP4ER: Bootstrap Prompting for Explicit Reasoning in Medical Dialogue Generation はコメントを受け付けていません

Echo-chambers and Idea Labs: Communication Styles on Twitter

要約 この論文では、ワクチン接種の文脈における Twitter (X) コミュニ … 続きを読む

カテゴリー: cs.CL, cs.SI, J.4 | Echo-chambers and Idea Labs: Communication Styles on Twitter はコメントを受け付けていません

Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting

要約 大規模言語モデル (LLM) を使用して、クエリと候補ドキュメントをプロン … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting はコメントを受け付けていません

Mixed Preference Optimization: Reinforcement Learning with Data Selection and Better Reference Model

要約 大規模言語モデル (LLM) は、自然言語を処理および生成できるため、ます … 続きを読む

カテゴリー: cs.CL | Mixed Preference Optimization: Reinforcement Learning with Data Selection and Better Reference Model はコメントを受け付けていません

JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

要約 文書質疑応答は、報告書、スライド、パンフレット、ウェブサイトなどの与えられ … 続きを読む

カテゴリー: cs.CL | JDocQA: Japanese Document Question Answering Dataset for Generative Language Models はコメントを受け付けていません

PrOnto: Language Model Evaluations for 859 Languages

要約 評価データセットは、事前トレーニングされた言語モデルの品質を測定するための … 続きを読む

カテゴリー: cs.CL | PrOnto: Language Model Evaluations for 859 Languages はコメントを受け付けていません

OffLanDat: A Community Based Implicit Offensive Language Dataset Generated by Large Language Model Through Prompt Engineering

要約 ソーシャルメディア上に憎悪に満ちた言葉が蔓延することで、社会の幸福に悪影響 … 続きを読む

カテゴリー: cs.CL | OffLanDat: A Community Based Implicit Offensive Language Dataset Generated by Large Language Model Through Prompt Engineering はコメントを受け付けていません

Phonetic Segmentation of the UCLA Phonetics Lab Archive

要約 音声技術と比較言語学の研究は、多様でアクセス可能な音声データへのアクセスに … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Phonetic Segmentation of the UCLA Phonetics Lab Archive はコメントを受け付けていません