要約
配管計装図 (P&ID) は、エンジニアリング業界やプロセス業界におけるワークフローの設計、構築、運用の基礎となります。
ただし、手動での作成は多くの場合、労働集約的でエラーが発生しやすく、エラーの検出と修正のための堅牢なメカニズムが欠けています。
生成 AI、特にラージ言語モデル (LLM) とビジョン言語モデル (VLM) の最近の進歩は、さまざまなドメインにわたって大きな可能性を示していますが、エンジニアリング ワークフローの生成の自動化におけるその応用はまだ十分に研究されていません。
この研究では、自然言語記述からの P&ID の生成を自動化するための新しいコパイロットを紹介します。
マルチステップのエージェントワークフローを活用する当社のコパイロットは、自然言語プロンプトから直接図を作成するための構造化された反復的なアプローチを提供します。
ワークフローの健全性と完全性を評価することで生成プロセスの実現可能性を実証し、バニラのゼロショットおよび少数ショット生成アプローチと比較して改善された結果を示します。
要約(オリジナル)
The Piping and Instrumentation Diagrams (P&IDs) are foundational to the design, construction, and operation of workflows in the engineering and process industries. However, their manual creation is often labor-intensive, error-prone, and lacks robust mechanisms for error detection and correction. While recent advancements in Generative AI, particularly Large Language Models (LLMs) and Vision-Language Models (VLMs), have demonstrated significant potential across various domains, their application in automating generation of engineering workflows remains underexplored. In this work, we introduce a novel copilot for automating the generation of P&IDs from natural language descriptions. Leveraging a multi-step agentic workflow, our copilot provides a structured and iterative approach to diagram creation directly from Natural Language prompts. We demonstrate the feasibility of the generation process by evaluating the soundness and completeness of the workflow, and show improved results compared to vanilla zero-shot and few-shot generation approaches.
arxiv情報
著者 | Shreeyash Gowaikar,Srinivasan Iyengar,Sameer Segal,Shivkumar Kalyanaraman |
発行日 | 2024-12-17 13:21:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google