Scaling Data Science Solutions with Semantics and Machine Learning: Bosch Case

要約

インダストリー 4.0 とモノのインターネット (IoT) テクノロジーにより、工場の生産から前例のない量のデータが解放され、量と種類の点でビッグデータの課題が生じています。
その中で、クラウド システムなどの分散コンピューティング ソリューションを活用して、データ処理を並列化し、計算時間を短縮します。
クラウド システムの普及が進むにつれて、もともとクラウドの専門家ではなかったより多くのユーザー (データ サイエンティストやドメインの専門家など) がクラウド システムにソリューションを展開するという需要が高まっています。
ただし、クラウド システム ユーザーの高い需要とユーザーのトレーニングに必要な過剰な時間の両方に対処することは簡単ではありません。
この目的を達成するために、私たちは、クラウド システムとセマンティック テクノロジおよび機械学習を結合する、セマンティクスが強化されたクラウド システムである SemCloud を提案します。
SemCloud は、データ統合のためにドメイン オントロジーとマッピングに依存し、分散コンピューティング ノード上でセマンティック データ統合とデータ分析を並列化します。
さらに、SemCloud は適応型 Datalog ルールと機械学習を採用して自動リソース構成を実現し、クラウドの専門家以外でもクラウド システムを使用できるようにします。
このシステムは、数百万のデータ、数千回の繰り返し実行、およびドメイン ユーザーを含む産業用ユースケースで評価され、有望な結果が示されています。

要約(オリジナル)

Industry 4.0 and Internet of Things (IoT) technologies unlock unprecedented amount of data from factory production, posing big data challenges in volume and variety. In that context, distributed computing solutions such as cloud systems are leveraged to parallelise the data processing and reduce computation time. As the cloud systems become increasingly popular, there is increased demand that more users that were originally not cloud experts (such as data scientists, domain experts) deploy their solutions on the cloud systems. However, it is non-trivial to address both the high demand for cloud system users and the excessive time required to train them. To this end, we propose SemCloud, a semantics-enhanced cloud system, that couples cloud system with semantic technologies and machine learning. SemCloud relies on domain ontologies and mappings for data integration, and parallelises the semantic data integration and data analysis on distributed computing nodes. Furthermore, SemCloud adopts adaptive Datalog rules and machine learning for automated resource configuration, allowing non-cloud experts to use the cloud system. The system has been evaluated in industrial use case with millions of data, thousands of repeated runs, and domain users, showing promising results.

arxiv情報

著者 Baifan Zhou,Nikolay Nikolov,Zhuoxun Zheng,Xianghui Luo,Ognjen Savkovic,Dumitru Roman,Ahmet Soylu,Evgeny Kharlamov
発行日 2023-08-02 11:58:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC パーマリンク