GEO: Generative Engine Optimization

要約

大規模言語モデル (LLM) の出現により、生成モデルを使用して情報を収集および要約し、ユーザーのクエリに答える検索エンジンの新しいパラダイムが到来しました。
この新しいテクノロジーは、生成エンジン (GE) の統一フレームワークの下で形式化されており、正確でパーソナライズされた応答を生成することができ、Google や Bing などの従来の検索エンジンを急速に置き換えることができます。
生成エンジンは通常、複数のソースからの情報を合成し、LLM を使用してそれらを要約することによってクエリに対応します。
この移行により $\textit{user}$ ユーティリティと $\textit{生成検索エンジン}$ トラフィックが大幅に改善されましたが、3 番目の利害関係者である Web サイトとコンテンツ作成者にとっては大きな課題となっています。
生成エンジンのブラックボックスで動きの速い性質を考えると、コンテンツ作成者は、コンテンツが $\textit{いつ}$ および $\textit{どのように}$ 表示されるかをほとんど、またはまったく制御できません。
生成エンジンが今後も存続する中で、私たちはクリエイターの経済が不利にならないようにしなければなりません。
これに対処するために、可視性メトリクスを最適化および定義するための柔軟なブラックボックス最適化フレームワークを通じて、コンテンツ作成者が生成エンジンの応答におけるコンテンツの可視性を向上させるのを支援する最初の新しいパラダイムである生成エンジン最適化 (GEO) を導入します。
複数のドメインにわたる多様なユーザー クエリの大規模なベンチマークである GEO ベンチと、これらのクエリに答えるための関連 Web ソースを導入することで、体系的な評価を促進します。
厳密な評価を通じて、GEO が生成エンジンの応答において可視性を最大 $40\%$ 向上させることができることを実証しました。
さらに、これらの戦略の有効性がドメイン間で異なることを示し、ドメイン固有の最適化手法の必要性を強調しています。
私たちの取り組みは、情報発見システムの新たな境地を開き、生成エンジンの開発者とコンテンツ作成者の両方に重大な影響を及ぼします。

要約(オリジナル)

The advent of large language models (LLMs) has ushered in a new paradigm of search engines that use generative models to gather and summarize information to answer user queries. This emerging technology, which we formalize under the unified framework of generative engines (GEs), can generate accurate and personalized responses, rapidly replacing traditional search engines like Google and Bing. Generative Engines typically satisfy queries by synthesizing information from multiple sources and summarizing them using LLMs. While this shift significantly improves $\textit{user}$ utility and $\textit{generative search engine}$ traffic, it poses a huge challenge for the third stakeholder — website and content creators. Given the black-box and fast-moving nature of generative engines, content creators have little to no control over $\textit{when}$ and $\textit{how}$ their content is displayed. With generative engines here to stay, we must ensure the creator economy is not disadvantaged. To address this, we introduce Generative Engine Optimization (GEO), the first novel paradigm to aid content creators in improving their content visibility in generative engine responses through a flexible black-box optimization framework for optimizing and defining visibility metrics. We facilitate systematic evaluation by introducing GEO-bench, a large-scale benchmark of diverse user queries across multiple domains, along with relevant web sources to answer these queries. Through rigorous evaluation, we demonstrate that GEO can boost visibility by up to $40\%$ in generative engine responses. Moreover, we show the efficacy of these strategies varies across domains, underscoring the need for domain-specific optimization methods. Our work opens a new frontier in information discovery systems, with profound implications for both developers of generative engines and content creators.

arxiv情報

著者 Pranjal Aggarwal,Vishvak Murahari,Tanmay Rajpurohit,Ashwin Kalyan,Karthik Narasimhan,Ameet Deshpande
発行日 2024-06-28 17:59:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク