LLM-Powered Proactive Data Systems

要約

LLMSの力により、テキスト、画像、ビデオなど、以前にクエリすることが不可能だったデータを照会する機能があります。
しかし、この大きな可能性にもかかわらず、LLMを活用するほとんどの現在のデータシステムは反応的であり、LLMを既知の抽象化にマッピングしたいというコミュニティの欲求を反映しています。
ほとんどのデータシステムは、LLMSを、他のリレーショナル演算子と組み合わせて、他のおおよその高価なUDFと同じようにユーザー入力とデータを最適化する不透明なブラックボックスとして扱います。
このようなデータシステムは、指示されているとおりに行われますが、LLMが求められていることを理解して活用していません(つまり、エラーが発生しやすい可能性があります)、LLMが動作しているデータ(例えば、長く、複雑です。
ドキュメント)、またはユーザーが本当に必要とするもの。
手元の操作やデータの特性を利用したり、不正確さとあいまいさがある場合に結果の正しさを確保したりしません。
私たちは、データシステムを積極的にする必要があると主張します。ユーザーの入力とデータを理解し、作り直し、操作とデータがどのようにデータをすべきかを決定するために、より多くの代理店(LLMの力)を与えられる必要があると主張します。
表現され、処理されます。
データシステムがユーザーの入力とデータを解析、書き換え、分解するか、標準のシングルショットクエリと結果のパラダイムを超える方法でユーザーと対話することを許可することにより、データシステムはユーザーのニーズにより効率的に対応でき、
効果的に。
これらの新しい機能は、データシステムがより多くのイニシアチブをとる豊富な設計スペースにつながります。変換操作、データ特性、およびユーザーの意図に基づいて最適化を実行できるようになります。
このフレームワークがどのように行われ、実際のタスクに適用され、適用されることができるさまざまな例を説明し、この野心的な研究アジェンダの将来の方向性を提示します。

要約(オリジナル)

With the power of LLMs, we now have the ability to query data that was previously impossible to query, including text, images, and video. However, despite this enormous potential, most present-day data systems that leverage LLMs are reactive, reflecting our community’s desire to map LLMs to known abstractions. Most data systems treat LLMs as an opaque black box that operates on user inputs and data as is, optimizing them much like any other approximate, expensive UDFs, in conjunction with other relational operators. Such data systems do as they are told, but fail to understand and leverage what the LLM is being asked to do (i.e. the underlying operations, which may be error-prone), the data the LLM is operating on (e.g., long, complex documents), or what the user really needs. They don’t take advantage of the characteristics of the operations and/or the data at hand, or ensure correctness of results when there are imprecisions and ambiguities. We argue that data systems instead need to be proactive: they need to be given more agency — armed with the power of LLMs — to understand and rework the user inputs and the data and to make decisions on how the operations and the data should be represented and processed. By allowing the data system to parse, rewrite, and decompose user inputs and data, or to interact with the user in ways that go beyond the standard single-shot query-result paradigm, the data system is able to address user needs more efficiently and effectively. These new capabilities lead to a rich design space where the data system takes more initiative: they are empowered to perform optimization based on the transformation operations, data characteristics, and user intent. We discuss various successful examples of how this framework has been and can be applied in real-world tasks, and present future directions for this ambitious research agenda.

arxiv情報

著者 Sepanta Zeighami,Yiming Lin,Shreya Shankar,Aditya Parameswaran
発行日 2025-02-18 16:34:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB パーマリンク