SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems

要約

サロゲート モデルは、従来の数値手法ではシミュレーションするには高価すぎる複雑なエネルギー システムの動作を予測するために使用されます。
私たちの研究では、そのようなサロゲートとのインターフェースとして、「システム キャプション」または SysCap と呼ばれる言語記述の使用を導入しています。
私たちは、テキスト、特に自然言語を介してサロゲートと対話することで、専門家と非専門家の両方にとってこれらのモデルがよりアクセスしやすくなると主張します。
軽量のマルチモーダル テキストおよび時系列回帰モデルと、大規模言語モデル (LLM) を使用してシミュレーション メタデータから高品質のキャプションを合成するトレーニング パイプラインを導入します。
建物と風力発電所の 2 つの現実世界のシミュレーターでの実験では、SysCaps で拡張されたサロゲートが、同じテスト システムの意味的に関連する記述の処理など、新しい一般化能力を享受しながら、従来の方法よりもホールドアウト システムでの精度が高いことが示されました。
追加の実験では、SysCaps が言語駆動型の設計空間探索を可能にし、迅速な拡張を通じてトレーニングを規則化できる可能性も強調しています。

要約(オリジナル)

Surrogate models are used to predict the behavior of complex energy systems that are too expensive to simulate with traditional numerical methods. Our work introduces the use of language descriptions, which we call ‘system captions’ or SysCaps, to interface with such surrogates. We argue that interacting with surrogates through text, particularly natural language, makes these models more accessible for both experts and non-experts. We introduce a lightweight multimodal text and timeseries regression model and a training pipeline that uses large language models (LLMs) to synthesize high-quality captions from simulation metadata. Our experiments on two real-world simulators of buildings and wind farms show that our SysCaps-augmented surrogates have better accuracy on held-out systems than traditional methods while enjoying new generalization abilities, such as handling semantically related descriptions of the same test system. Additional experiments also highlight the potential of SysCaps to unlock language-driven design space exploration and to regularize training through prompt augmentation.

arxiv情報

著者 Patrick Emami,Zhaonan Li,Saumya Sinha,Truc Nguyen
発行日 2024-10-02 16:23:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, cs.SY, eess.SY パーマリンク