DataLab: A Unified Platform for LLM-Powered Business Intelligence

要約

Business Intelligence(BI)は、近代的な組織内の大量のデータを、情報に基づいた意思決定のための実用的な洞察に変換します。
最近、大規模な言語モデル(LLM)ベースのエージェントは、自然言語(NL)クエリに基づく実行可能環境でタスク計画、推論、およびアクションを自動的に実行することにより、BIワークフローを合理化しました。
ただし、既存のアプローチは、主にNL2SQLやNL2VISなどの個々のBIタスクに焦点を当てています。
さまざまなデータの役割とツールにわたるタスクの断片化は、BIの反復的および共同性の性質による非効率性と潜在的なエラーにつながります。
このホワイトペーパーでは、ワンストップLLMベースのエージェントフレームワークを拡張した計算ノートブックインターフェースと統合する統合されたBIプラットフォームであるDatalabを紹介します。
Datalabは、LLMの支援と単一の環境内でのユーザーのカスタマイズをシームレスに組み合わせることにより、データの準備、分析、視覚化におけるさまざまなデータの役割に関するさまざまなBIタスクをサポートしています。
この統合を実現するために、エンタープライズ固有のBIタスクに合わせたドメインナレッジインコルア酸モジュール、BIワークフロー全体の情報共有を促進するエージェント間のコミュニケーションメカニズム、およびBIノートブックのコンテキスト利用効率を強化するセルベースのコンテキスト管理戦略を設計します。
広範な実験は、Datalabが一般的な研究ベンチマーク全体でさまざまなBIタスクで最先端のパフォーマンスを達成することを示しています。
さらに、Datalabは、Tencentの実際のデータセットに対する高い効果と効率を維持し、精度が58.58%増加し、企業固有のBIタスクのトークンコストが61.65%削減されました。

要約(オリジナル)

Business intelligence (BI) transforms large volumes of data within modern organizations into actionable insights for informed decision-making. Recently, large language model (LLM)-based agents have streamlined the BI workflow by automatically performing task planning, reasoning, and actions in executable environments based on natural language (NL) queries. However, existing approaches primarily focus on individual BI tasks such as NL2SQL and NL2VIS. The fragmentation of tasks across different data roles and tools lead to inefficiencies and potential errors due to the iterative and collaborative nature of BI. In this paper, we introduce DataLab, a unified BI platform that integrates a one-stop LLM-based agent framework with an augmented computational notebook interface. DataLab supports various BI tasks for different data roles in data preparation, analysis, and visualization by seamlessly combining LLM assistance with user customization within a single environment. To achieve this unification, we design a domain knowledge incorporation module tailored for enterprise-specific BI tasks, an inter-agent communication mechanism to facilitate information sharing across the BI workflow, and a cell-based context management strategy to enhance context utilization efficiency in BI notebooks. Extensive experiments demonstrate that DataLab achieves state-of-the-art performance on various BI tasks across popular research benchmarks. Moreover, DataLab maintains high effectiveness and efficiency on real-world datasets from Tencent, achieving up to a 58.58% increase in accuracy and a 61.65% reduction in token cost on enterprise-specific BI tasks.

arxiv情報

著者 Luoxuan Weng,Yinghao Tang,Yingchaojie Feng,Zhuo Chang,Ruiqin Chen,Haozhe Feng,Chen Hou,Danqing Huang,Yang Li,Huaming Rao,Haonan Wang,Canshi Wei,Xiaofeng Yang,Yuhui Zhang,Yifeng Zheng,Xiuqi Huang,Minfeng Zhu,Yuxin Ma,Bin Cui,Peng Chen,Wei Chen
発行日 2025-04-07 12:01:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.DB パーマリンク