Model-Driven Engineering Method to Support the Formalization of Machine Learning using SysML


方法: この研究では、システム モデリング言語 SysML の形式化においてモデルベース エンジニアリングを活用することにより、機械学習タスクの共同定義をサポートする方法を導入します。
この方法は、さまざまなデータ ソースの識別と統合、データ属性間のセマンティック接続の必要な定義、および機械学習サポート内のデータ処理ステップの定義をサポートします。
結果: ドメインおよび機械学習の専門家の知識を統合することにより、システム モデリング言語 SysML を使用して知識を形式化し、機械学習タスクを記述する強力なツールが導入されました。
結論: 機械学習固有のプロパティをシステム エンジニアリング手法に統合することで、データ サイエンティスト以外でも形式化された知識を理解し、機械学習の問題の特定の側面を定義し、データに関する知識を文書化し、データ サイエンティストが形式化された知識を入力として使用できるようにすることができます。
(半) 自動コード生成を使用した実装の場合。


Methods: This work introduces a method supporting the collaborative definition of machine learning tasks by leveraging model-based engineering in the formalization of the systems modeling language SysML. The method supports the identification and integration of various data sources, the required definition of semantic connections between data attributes, and the definition of data processing steps within the machine learning support. Results: By consolidating the knowledge of domain and machine learning experts, a powerful tool to describe machine learning tasks by formalizing knowledge using the systems modeling language SysML is introduced. The method is evaluated based on two use cases, i.e., a smart weather system that allows to predict weather forecasts based on sensor data, and a waste prevention case for 3D printer filament that cancels the printing if the intended result cannot be achieved (image processing). Further, a user study is conducted to gather insights of potential users regarding perceived workload and usability of the elaborated method. Conclusion: Integrating machine learning-specific properties in systems engineering techniques allows non-data scientists to understand formalized knowledge and define specific aspects of a machine learning problem, document knowledge on the data, and to further support data scientists to use the formalized knowledge as input for an implementation using (semi-) automatic code generation. In this respect, this work contributes by consolidating knowledge from various domains and therefore, fosters the integration of machine learning in industry by involving several stakeholders.


著者 Simon Raedler,Juergen Mangler,Stefanie Rinderle-Ma
発行日 2023-07-10 11:33:46+00:00
カテゴリー: cs.AI, cs.SE, I.2.4 パーマリンク