要約
ビジネス インテリジェンス (BI) は、現代の組織内の大量のデータを、情報に基づいた意思決定のための実用的な洞察に変換します。
最近では、大規模言語モデル (LLM) ベースのエージェントが、自然言語 (NL) クエリに基づいて実行可能環境でタスクの計画、推論、アクションを自動的に実行することで、BI ワークフローを合理化しています。
ただし、既存のアプローチは主に、NL2SQL や NL2VIS などの個々の BI タスクに焦点を当てています。
BI は反復的で協調的な性質を持っているため、さまざまなデータの役割やツール間でタスクが断片化すると、非効率性や潜在的なエラーが発生します。
このペーパーでは、ワンストップの LLM ベースのエージェント フレームワークと拡張された計算ノートブック インターフェイスを統合する統合 BI プラットフォームである DataLab を紹介します。
DataLab は、単一環境内で LLM 支援とユーザーのカスタマイズをシームレスに組み合わせることで、さまざまなデータの役割に対する幅広い BI タスクをサポートします。
この統合を実現するために、企業固有の BI タスクに合わせたドメイン ナレッジ組み込みモジュール、BI ワークフロー全体での情報共有を促進するエージェント間通信メカニズム、BI でのコンテキスト利用効率を高めるセルベースのコンテキスト管理戦略を設計します。
ノート。
広範な実験により、DataLab が一般的な研究ベンチマーク全体のさまざまな BI タスクで最先端のパフォーマンスを達成していることが実証されています。
さらに、DataLab は Tencent の実世界のデータセットに対して高い有効性と効率を維持し、企業固有の BI タスクで最大 58.58% の精度の向上と 61.65% のトークンコストの削減を達成しました。
要約(オリジナル)
Business intelligence (BI) transforms large volumes of data within modern organizations into actionable insights for informed decision-making. Recently, large language model (LLM)-based agents have streamlined the BI workflow by automatically performing task planning, reasoning, and actions in executable environments based on natural language (NL) queries. However, existing approaches primarily focus on individual BI tasks such as NL2SQL and NL2VIS. The fragmentation of tasks across different data roles and tools lead to inefficiencies and potential errors due to the iterative and collaborative nature of BI. In this paper, we introduce DataLab, a unified BI platform that integrates a one-stop LLM-based agent framework with an augmented computational notebook interface. DataLab supports a wide range of BI tasks for different data roles by seamlessly combining LLM assistance with user customization within a single environment. To achieve this unification, we design a domain knowledge incorporation module tailored for enterprise-specific BI tasks, an inter-agent communication mechanism to facilitate information sharing across the BI workflow, and a cell-based context management strategy to enhance context utilization efficiency in BI notebooks. Extensive experiments demonstrate that DataLab achieves state-of-the-art performance on various BI tasks across popular research benchmarks. Moreover, DataLab maintains high effectiveness and efficiency on real-world datasets from Tencent, achieving up to a 58.58% increase in accuracy and a 61.65% reduction in token cost on enterprise-specific BI tasks.
arxiv情報
著者 | Luoxuan Weng,Yinghao Tang,Yingchaojie Feng,Zhuo Chang,Peng Chen,Ruiqin Chen,Haozhe Feng,Chen Hou,Danqing Huang,Yang Li,Huaming Rao,Haonan Wang,Canshi Wei,Xiaofeng Yang,Yuhui Zhang,Yifeng Zheng,Xiuqi Huang,Minfeng Zhu,Yuxin Ma,Bin Cui,Wei Chen |
発行日 | 2024-12-04 16:12:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google