月別アーカイブ: 2024年7月

Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning

要約 現在の大規模言語モデル パイプラインで広く採用されているアプローチであるヒ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning はコメントを受け付けていません

SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training

要約 大規模言語モデル (LLM) の有効性は、大規模な事前トレーニング データ … 続きを読む

カテゴリー: cs.AI, cs.CL | SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training はコメントを受け付けていません

TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems

要約 時間的関係抽出 (TRE) は、イベントやアクションの展開を把握し、関連す … 続きを読む

カテゴリー: cs.CL | TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems はコメントを受け付けていません

Mixture-of-Modules: Reinventing Transformers as Dynamic Assemblies of Modules

要約 Transformers の浅い層から深い層までトークンを計算する必要は常 … 続きを読む

カテゴリー: cs.CL | Mixture-of-Modules: Reinventing Transformers as Dynamic Assemblies of Modules はコメントを受け付けていません

Consistent Document-Level Relation Extraction via Counterfactuals

要約 ドキュメントレベルの関係抽出 (RE) モデルをトレーニングおよび評価する … 続きを読む

カテゴリー: cs.CL | Consistent Document-Level Relation Extraction via Counterfactuals はコメントを受け付けていません

Probabilistically-Sound Beam Search with Masked Language Models

要約 マスク言語モデル (MLM) を使用したビーム探索は、自己回帰モデルとは異 … 続きを読む

カテゴリー: cs.CL, cs.LG | Probabilistically-Sound Beam Search with Masked Language Models はコメントを受け付けていません

Beyond Probabilities: Unveiling the Misalignment in Evaluating Large Language Models

要約 大規模言語モデル (LLM) は、さまざまなアプリケーションにわたって優れ … 続きを読む

カテゴリー: cs.CL | Beyond Probabilities: Unveiling the Misalignment in Evaluating Large Language Models はコメントを受け付けていません

Unlocking the Potential of Model Merging for Low-Resource Languages

要約 大規模言語モデル (LLM) を新しい言語に適応させるには、通常、継続的な … 続きを読む

カテゴリー: cs.AI, cs.CL | Unlocking the Potential of Model Merging for Low-Resource Languages はコメントを受け付けていません

Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions

要約 私たちのチームは、BioASQ 2024 Task12b および Syne … 続きを読む

カテゴリー: cs.CL | Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions はコメントを受け付けていません

Not All Layers of LLMs Are Necessary During Inference

要約 パラメータの数が多いため、大規模言語モデル (LLM) の推論フェーズでは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Not All Layers of LLMs Are Necessary During Inference はコメントを受け付けていません