Leveraging Large Language Model for Automatic Evolving of Industrial Data-Centric R&D Cycle

要約

絶え間ないデジタル変革をきっかけに、予測、異常検出、計画、さらには複雑な意思決定など、さまざまな産業タスクに対処する強力なツールとしてデータ駆動型ソリューションが登場しています。
データ中心の研究開発は、これらのソリューションを活用する上で極めて重要ですが、多くの場合、人的リソース、計算リソース、時間リソースの点で多大なコストがかかります。
このホワイトペーパーでは、データ中心の研究開発の進化サイクルを促進する大規模言語モデル (LLM) の可能性を詳しく掘り下げています。
異種タスク関連データ、多面的なドメイン知識、多様なコンピューティング機能ツールなど、データ中心の研究開発の基礎要素を評価し、LLM がドメイン固有の要件をどの程度理解し、専門的なアイデアを生成し、ドメイン固有の機能を活用できるかを調査します。
実験を実施し、結果を解釈し、過去の取り組みからの知識を取り入れて新しい課題に取り組むためのツール。
私たちは産業データ中心の研究開発シナリオの典型的な例として定量的投資研究を取り上げ、フルスタックのオープンソースの定量的研究プラットフォーム Qlib 上で提案したフレームワークを検証し、産業データの自動進化というビジョンに光を当てる有望な結果を得ました。
中心的な研究開発サイクル。

要約(オリジナル)

In the wake of relentless digital transformation, data-driven solutions are emerging as powerful tools to address multifarious industrial tasks such as forecasting, anomaly detection, planning, and even complex decision-making. Although data-centric R&D has been pivotal in harnessing these solutions, it often comes with significant costs in terms of human, computational, and time resources. This paper delves into the potential of large language models (LLMs) to expedite the evolution cycle of data-centric R&D. Assessing the foundational elements of data-centric R&D, including heterogeneous task-related data, multi-facet domain knowledge, and diverse computing-functional tools, we explore how well LLMs can understand domain-specific requirements, generate professional ideas, utilize domain-specific tools to conduct experiments, interpret results, and incorporate knowledge from past endeavors to tackle new challenges. We take quantitative investment research as a typical example of industrial data-centric R&D scenario and verified our proposed framework upon our full-stack open-sourced quantitative research platform Qlib and obtained promising results which shed light on our vision of automatic evolving of industrial data-centric R&D cycle.

arxiv情報

著者 Xu Yang,Xiao Yang,Weiqing Liu,Jinhui Li,Peng Yu,Zeqi Ye,Jiang Bian
発行日 2023-10-17 13:18:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, q-fin.GN パーマリンク