月別アーカイブ: 2024年1月

Batch-ICL: Effective, Efficient, and Order-Agnostic In-Context Learning

要約 この論文では、コンテキスト内学習 (ICL) をメタ最適化プロセスとして扱 … 続きを読む

カテゴリー: cs.CL, cs.LG | Batch-ICL: Effective, Efficient, and Order-Agnostic In-Context Learning はコメントを受け付けていません

An investigation of structures responsible for gender bias in BERT and DistilBERT

要約 近年、大規模な Transformer ベースの事前トレーニング済み言語モ … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | An investigation of structures responsible for gender bias in BERT and DistilBERT はコメントを受け付けていません

AntEval: Quantitatively Evaluating Informativeness and Expressiveness of Agent Social Interactions

要約 大規模言語モデル (LLM) ベースのエージェントは、さまざまなシナリオで … 続きを読む

カテゴリー: cs.CL | AntEval: Quantitatively Evaluating Informativeness and Expressiveness of Agent Social Interactions はコメントを受け付けていません

MetaHate: A Dataset for Unifying Efforts on Hate Speech Detection

要約 ヘイトスピーチは、蔓延する有害なオンライン言説の一種であり、多くの場合、憎 … 続きを読む

カテゴリー: cs.CL, cs.SI | MetaHate: A Dataset for Unifying Efforts on Hate Speech Detection はコメントを受け付けていません

Improving Language Plasticity via Pretraining with Active Forgetting

要約 事前トレーニング済み言語モデル (PLM) は、現在、自然言語処理の主要な … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.NE | Improving Language Plasticity via Pretraining with Active Forgetting はコメントを受け付けていません

INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにおいて優れ … 続きを読む

カテゴリー: cs.CL, cs.IR | INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning はコメントを受け付けていません

Assessing the Importance of Frequency versus Compositionality for Subword-based Tokenization in NMT

要約 サブワードのトークン化は、ニューラル言語モデルおよび機械翻訳システムにおけ … 続きを読む

カテゴリー: cs.CL | Assessing the Importance of Frequency versus Compositionality for Subword-based Tokenization in NMT はコメントを受け付けていません

Intention Analysis Prompting Makes Large Language Models A Good Jailbreak Defender

要約 大規模言語モデル (LLM) を人間の価値観に合わせるのは、特にステルスで … 続きを読む

カテゴリー: cs.CL | Intention Analysis Prompting Makes Large Language Models A Good Jailbreak Defender はコメントを受け付けていません

Multistage Collaborative Knowledge Distillation from Large Language Models for Semi-Supervised Sequence Generation

要約 私たちは、ラベル付きデータが不足しすぎてモデルを効果的に微調整できないと同 … 続きを読む

カテゴリー: cs.CL, cs.LG | Multistage Collaborative Knowledge Distillation from Large Language Models for Semi-Supervised Sequence Generation はコメントを受け付けていません

Mergen: The First Manchu-Korean Machine Translation Model Trained on Augmented Data

要約 満州語は、中国東北部の歴史的な満州地域にルーツを持つ言語ですが、話者がほと … 続きを読む

カテゴリー: cs.CL | Mergen: The First Manchu-Korean Machine Translation Model Trained on Augmented Data はコメントを受け付けていません