Pub/Sub Message Brokers for GenAI

要約

今日のデジタル世界では、大規模言語モデル (LLM) などの生成人工知能 (GenAI) がますます普及しており、その範囲はさまざまなアプリケーションにわたって広がっています。
この導入の急増により、データ中心の GenAI モデルに対する需要が大幅に増加し、堅牢なデータ通信インフラストラクチャの必要性が浮き彫りになりました。
このニーズの中心となるのは、さまざまなシステム コンポーネント内でのデータ転送に不可欠なチャネルとして機能するメッセージ ブローカーです。
この調査は、従来のメッセージ ブローカーと最新のメッセージ ブローカーの包括的な分析を掘り下げ、普及しているプラ​​ットフォームの比較研究を行うことを目的としています。
私たちの調査では、オープンソースの可用性、統合監視ツール、メッセージの優先順位付けメカニズム、並列処理の機能、信頼性、分散およびクラスタリング機能、認証プロセス、データ永続化戦略、フォールト トレランス、スケーラビリティなどを含むがこれらに限定されない多数の基準を考慮しています。
さらに、これらの制限が実際の適用可能性を理解する上で重要であることを認識し、各メッセージ ブローカーの設計と運用が課す可能性のある本質的な制約を調査します。
次に、これらの洞察を活用して、GenAI アプリケーションの進化する要件を満たすために必要な適応性と堅牢性を備えた、洗練されたメッセージ ブローカー フレームワークを提案します。
最後に、この研究では、GenAI コンテキストに特化したメッセージ ブローカー メカニズムの強化を検証し、汎用性の高いメッセージ ブローカー フレームワークを開発することの重要性を強調しています。
このようなフレームワークは、近い将来の GenAI のダイナミックで増大する需要に応え、迅速に適応できる態勢が整っているでしょう。
この二面的なアプローチを通じて、私たちは GenAI データ通信の分野における将来のイノベーションとインフラストラクチャの進歩を導くことができる基礎的な概要を提供するつもりです。

要約(オリジナル)

In today’s digital world, Generative Artificial Intelligence (GenAI) such as Large Language Models (LLMs) is becoming increasingly prevalent, extending its reach across diverse applications. This surge in adoption has sparked a significant increase in demand for data-centric GenAI models, highlighting the necessity for robust data communication infrastructures. Central to this need are message brokers, which serve as essential channels for data transfer within various system components. This survey aims to delve into a comprehensive analysis of traditional and modern message brokers, offering a comparative study of prevalent platforms. Our study considers numerous criteria including, but not limited to, open-source availability, integrated monitoring tools, message prioritization mechanisms, capabilities for parallel processing, reliability, distribution and clustering functionalities, authentication processes, data persistence strategies, fault tolerance, and scalability. Furthermore, we explore the intrinsic constraints that the design and operation of each message broker might impose, recognizing that these limitations are crucial in understanding their real-world applicability. We then leverage these insights to propose a sophisticated message broker framework — one designed with the adaptability and robustness necessary to meet the evolving requisites of GenAI applications. Finally, this study examines the enhancement of message broker mechanisms specifically for GenAI contexts, emphasizing the criticality of developing a versatile message broker framework. Such a framework would be poised for quick adaptation, catering to the dynamic and growing demands of GenAI in the foreseeable future. Through this dual-pronged approach, we intend to contribute a foundational compendium that can guide future innovations and infrastructural advancements in the realm of GenAI data communication.

arxiv情報

著者 Alaa Saleh,Susanna Pirttikangas,Lauri Lovén
発行日 2023-12-22 12:30:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC, cs.LG, cs.NI, I.2.11 パーマリンク