月別アーカイブ: 2023年5月

Are Pre-trained Language Models Useful for Model Ensemble in Chinese Grammatical Error Correction?

投稿日: 2023年5月25日作成者: jarxiv

要約モデルアンサンブルは、文法的誤り訂正 (GEC) のために広く使用されて … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Decoder Tuning: Efficient Language Understanding as Decoding

投稿日: 2023年5月25日作成者: jarxiv

要約事前トレーニング済みモデル (PTM) のサイズがますます大きくなっている … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Towards Adaptive Prefix Tuning for Parameter-Efficient Language Model Fine-tuning

投稿日: 2023年5月25日作成者: jarxiv

要約パラメータ全体を使用して、さまざまな下流タスクで大規模な事前トレーニング済 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Technical report: Graph Neural Networks go Grammatical

投稿日: 2023年5月25日作成者: jarxiv

要約この論文では、代数言語の一部をグラフニューラルネットワーク (GNN) … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SAIL: Search-Augmented Instruction Learning

投稿日: 2023年5月25日作成者: jarxiv

要約大規模言語モデル (LLM) は命令の微調整によって大幅に改善されましたが … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LMs with a Voice: Spoken Language Modeling beyond Speech Tokens

投稿日: 2023年5月25日作成者: jarxiv

要約我々は、事前に訓練された言語モデル (LM) を適応させて音声継続を実行す … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Revisiting Parallel Context Windows: A Frustratingly Simple Alternative and Chain-of-Thought Deterioration

投稿日: 2023年5月25日作成者: jarxiv

要約我々は、最近の並列統合手法であるパラレルコンテキストウィンドウ (PC … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of Language Model

投稿日: 2023年5月25日作成者: jarxiv

要約モデルのサイズが急速に増大するにつれて、メモリ使用量が膨大になるため、大規 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Revisiting Token Dropping Strategy in Efficient BERT Pretraining

投稿日: 2023年5月25日作成者: jarxiv

要約トークンドロップは、いくつかの中間層で入力トークンのサブセットの計算をス … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Self-Evolution Learning for Discriminative Language Model Pretraining

投稿日: 2023年5月25日作成者: jarxiv

要約マスクされた言語モデリングは、識別言語モデル (BERT など) の事前ト … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2023年5月

Are Pre-trained Language Models Useful for Model Ensemble in Chinese Grammatical Error Correction?

Decoder Tuning: Efficient Language Understanding as Decoding

Towards Adaptive Prefix Tuning for Parameter-Efficient Language Model Fine-tuning

Technical report: Graph Neural Networks go Grammatical

SAIL: Search-Augmented Instruction Learning

LMs with a Voice: Spoken Language Modeling beyond Speech Tokens

Revisiting Parallel Context Windows: A Frustratingly Simple Alternative and Chain-of-Thought Deterioration

Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of Language Model

Revisiting Token Dropping Strategy in Efficient BERT Pretraining

Self-Evolution Learning for Discriminative Language Model Pretraining

最近の投稿

最近のコメント

アーカイブ

カテゴリー