月別アーカイブ: 2023年8月

Attention Is Not All You Need Anymore

要約 近年、人気の高い Transformer アーキテクチャは、自然言語処理や … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.NE | Attention Is Not All You Need Anymore はコメントを受け付けていません

Better Zero-Shot Reasoning with Role-Play Prompting

要約 ChatGPT などの最新の大規模言語モデル (LLM) は、ロールプレイ … 続きを読む

カテゴリー: cs.CL | Better Zero-Shot Reasoning with Role-Play Prompting はコメントを受け付けていません

SPM: Structured Pretraining and Matching Architectures for Relevance Modeling in Meituan Search

要約 電子商取引の検索では、クエリとドキュメントの関連性は、ユーザー エクスペリ … 続きを読む

カテゴリー: cs.CL, cs.IR | SPM: Structured Pretraining and Matching Architectures for Relevance Modeling in Meituan Search はコメントを受け付けていません

Enhancing Visually-Rich Document Understanding via Layout Structure Modeling

要約 近年、マルチモーダルな事前トレーニング済みトランスフォーマーの使用により、 … 続きを読む

カテゴリー: cs.CL | Enhancing Visually-Rich Document Understanding via Layout Structure Modeling はコメントを受け付けていません

BatGPT: A Bidirectional Autoregessive Talker from Generative Pre-trained Transformer

要約 BatGPT は、武漢大学と上海交通大学が共同で設計、訓練した大規模な言語 … 続きを読む

カテゴリー: cs.CL | BatGPT: A Bidirectional Autoregessive Talker from Generative Pre-trained Transformer はコメントを受け付けていません

PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in Poetry Generation

要約 制御可能なテキスト生成は、自然言語生成 (NLG) において挑戦的かつ有意 … 続きを読む

カテゴリー: cs.CL | PoetryDiffusion: Towards Joint Semantic and Metrical Manipulation in Poetry Generation はコメントを受け付けていません

Stack More Layers Differently: High-Rank Training Through Low-Rank Updates

要約 スケーリングの優位性と有効性にもかかわらず、数千億のパラメーターを持つ大規 … 続きを読む

カテゴリー: cs.CL, cs.LG | Stack More Layers Differently: High-Rank Training Through Low-Rank Updates はコメントを受け付けていません

The Regular Expression Inference Challenge

要約 私たちは、コード/言語モデリングとより広範な機械学習コミュニティの課題とし … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | The Regular Expression Inference Challenge はコメントを受け付けていません

PromptStyler: Prompt-driven Style Generation for Source-free Domain Generalization

要約 共同視覚言語空間では、テキストの特徴(たとえば、「犬の写真」から)は、関連 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | PromptStyler: Prompt-driven Style Generation for Source-free Domain Generalization はコメントを受け付けていません

A Survey on Model Compression for Large Language Models

要約 大規模言語モデル (LLM) は、自然言語処理タスクに革命をもたらし、目覚 … 続きを読む

カテゴリー: cs.AI, cs.CL | A Survey on Model Compression for Large Language Models はコメントを受け付けていません