RIGHT: Retrieval-augmented Generation for Mainstream Hashtag Recommendation

要約

主流ハッシュタグの自動推奨は、公開前に簡潔で人気のある話題のハッシュタグをユーザーに正確に提供することを目的としています。
一般に、主流のハッシュタグの推奨は、新しいトピックに応じて新たに投稿されたツイートの総合的な難しさ、および意味上の正確さを超えた主流のハッシュタグの正確な識別という課題に直面しています。
ただし、固定の事前定義された主流ハッシュタグ リストに基づく以前の検索ベースの方法は、主流ハッシュタグの生成には優れていますが、最新情報の絶え間ない流れを理解できません。
逆に、世代ベースの方法は、新しく投稿されたツイートを理解する優れた能力を示しますが、その能力は、追加機能なしでは主流のハッシュタグを識別することに制限されています。
検索拡張技術の最近の成功に触発されて、この研究では、このフレームワークを採用して両方のアプローチの利点を組み合わせることを試みます。
その一方で、ジェネレーター コンポーネントの助けを借りて、低コストでレトリーバー コンポーネントの品質をさらに向上させる方法を再考することができました。
したがって、RetrIeval で拡張された生成メインストリーム ハッシュタグ レコメンダー (右) を提案します。これは 3 つのコンポーネントで構成されます。1) 検索者は、ツイート ハッシュタグ セット全体から関連するハッシュタグを探します。
2) セレクターは、グローバル信号を導入することで主流の識別を強化します。
3) ジェネレーターは入力ツイートと選択されたハッシュタグを組み込み、目的のハッシュタグを直接生成します。
実験結果は、私たちの方法が最先端のベースラインを超えて大幅な改善を達成することを示しています。
さらに、RIGHT は大規模な言語モデルに簡単に統合でき、ChatGPT のパフォーマンスが 10% 以上向上します。

要約(オリジナル)

Automatic mainstream hashtag recommendation aims to accurately provide users with concise and popular topical hashtags before publication. Generally, mainstream hashtag recommendation faces challenges in the comprehensive difficulty of newly posted tweets in response to new topics, and the accurate identification of mainstream hashtags beyond semantic correctness. However, previous retrieval-based methods based on a fixed predefined mainstream hashtag list excel in producing mainstream hashtags, but fail to understand the constant flow of up-to-date information. Conversely, generation-based methods demonstrate a superior ability to comprehend newly posted tweets, but their capacity is constrained to identifying mainstream hashtags without additional features. Inspired by the recent success of the retrieval-augmented technique, in this work, we attempt to adopt this framework to combine the advantages of both approaches. Meantime, with the help of the generator component, we could rethink how to further improve the quality of the retriever component at a low cost. Therefore, we propose RetrIeval-augmented Generative Mainstream HashTag Recommender (RIGHT), which consists of three components: 1) a retriever seeks relevant hashtags from the entire tweet-hashtags set; 2) a selector enhances mainstream identification by introducing global signals; and 3) a generator incorporates input tweets and selected hashtags to directly generate the desired hashtags. The experimental results show that our method achieves significant improvements over state-of-the-art baselines. Moreover, RIGHT can be easily integrated into large language models, improving the performance of ChatGPT by more than 10%.

arxiv情報

著者 Run-Ze Fan,Yixing Fan,Jiangui Chen,Jiafeng Guo,Ruqing Zhang,Xueqi Cheng
発行日 2023-12-16 14:47:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク