Model-Driven Engineering Method to Support the Formalization of Machine Learning using SysML

要約

方法: この研究では、システム モデリング言語 SysML の形式化においてモデルベース エンジニアリングを活用することにより、機械学習タスクの共同定義をサポートする方法を導入します。
この方法は、さまざまなデータ ソースの識別と統合、データ属性間のセマンティック接続の必要な定義、および機械学習サポート内のデータ処理ステップの定義をサポートします。
結果: ドメインおよび機械学習の専門家の知識を統合することにより、システム モデリング言語 SysML を使用して知識を形式化し、機械学習タスクを記述する強力なツールが導入されました。
センサーデータに基づいて天気予報を予測するスマートウェザーシステムと、意図した結果が得られない場合に印刷をキャンセルする3Dプリンターのフィラメントの無駄を防ぐケース(画像処理)の2つのユースケースに基づいて手法を評価します。
)。
さらに、ユーザー調査を実施して、認識されたワークロードと精緻な方法の使いやすさに関する潜在ユーザーの洞察を収集します。
結論: 機械学習固有のプロパティをシステム エンジニアリング手法に統合することで、データ サイエンティスト以外でも形式化された知識を理解し、機械学習の問題の特定の側面を定義し、データに関する知識を文書化し、データ サイエンティストが形式化された知識を入力として使用できるようにすることができます。
(半) 自動コード生成を使用した実装の場合。
この点で、この研究はさまざまな分野の知識を統合することで貢献し、複数の関係者を巻き込むことで業界での機械学習の統合を促進します。

要約(オリジナル)

Methods: This work introduces a method supporting the collaborative definition of machine learning tasks by leveraging model-based engineering in the formalization of the systems modeling language SysML. The method supports the identification and integration of various data sources, the required definition of semantic connections between data attributes, and the definition of data processing steps within the machine learning support. Results: By consolidating the knowledge of domain and machine learning experts, a powerful tool to describe machine learning tasks by formalizing knowledge using the systems modeling language SysML is introduced. The method is evaluated based on two use cases, i.e., a smart weather system that allows to predict weather forecasts based on sensor data, and a waste prevention case for 3D printer filament that cancels the printing if the intended result cannot be achieved (image processing). Further, a user study is conducted to gather insights of potential users regarding perceived workload and usability of the elaborated method. Conclusion: Integrating machine learning-specific properties in systems engineering techniques allows non-data scientists to understand formalized knowledge and define specific aspects of a machine learning problem, document knowledge on the data, and to further support data scientists to use the formalized knowledge as input for an implementation using (semi-) automatic code generation. In this respect, this work contributes by consolidating knowledge from various domains and therefore, fosters the integration of machine learning in industry by involving several stakeholders.

arxiv情報

著者 Simon Raedler,Juergen Mangler,Stefanie Rinderle-Ma
発行日 2023-07-10 11:33:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SE, I.2.4 パーマリンク