月別アーカイブ: 2024年7月

Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning

投稿日: 2024年7月10日作成者: jarxiv

要約現在の大規模言語モデルパイプラインで広く採用されているアプローチであるヒ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training

投稿日: 2024年7月10日作成者: jarxiv

要約大規模言語モデル (LLM) の有効性は、大規模な事前トレーニングデータ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems

投稿日: 2024年7月10日作成者: jarxiv

要約時間的関係抽出 (TRE) は、イベントやアクションの展開を把握し、関連す … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mixture-of-Modules: Reinventing Transformers as Dynamic Assemblies of Modules

投稿日: 2024年7月10日作成者: jarxiv

要約 Transformers の浅い層から深い層までトークンを計算する必要は常 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Consistent Document-Level Relation Extraction via Counterfactuals

投稿日: 2024年7月10日作成者: jarxiv

要約ドキュメントレベルの関係抽出 (RE) モデルをトレーニングおよび評価する … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Probabilistically-Sound Beam Search with Masked Language Models

投稿日: 2024年7月10日作成者: jarxiv

要約マスク言語モデル (MLM) を使用したビーム探索は、自己回帰モデルとは異 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Beyond Probabilities: Unveiling the Misalignment in Evaluating Large Language Models

投稿日: 2024年7月10日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなアプリケーションにわたって優れ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Unlocking the Potential of Model Merging for Low-Resource Languages

投稿日: 2024年7月10日作成者: jarxiv

要約大規模言語モデル (LLM) を新しい言語に適応させるには、通常、継続的な … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions

投稿日: 2024年7月10日作成者: jarxiv

要約私たちのチームは、BioASQ 2024 Task12b および Syne … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Not All Layers of LLMs Are Necessary During Inference

投稿日: 2024年7月10日作成者: jarxiv

要約パラメータの数が多いため、大規模言語モデル (LLM) の推論フェーズでは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年7月

Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning

SoftDedup: an Efficient Data Reweighting Method for Speeding Up Language Model Pre-training

TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems

Mixture-of-Modules: Reinventing Transformers as Dynamic Assemblies of Modules

Consistent Document-Level Relation Extraction via Counterfactuals

Probabilistically-Sound Beam Search with Masked Language Models

Beyond Probabilities: Unveiling the Misalignment in Evaluating Large Language Models

Unlocking the Potential of Model Merging for Low-Resource Languages

Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions

Not All Layers of LLMs Are Necessary During Inference

最近の投稿

最近のコメント

アーカイブ

カテゴリー