要約
この研究の目的は、最適なサポート環境を提供するために、人工知能 (AI) および機械学習 (ML) アプリケーションの開発プロセスを調査することです。
ML の主な段階は、問題の理解、データ管理、モデルの構築、モデルの展開、およびメンテナンスです。
このプロジェクトは、ML 開発のデータ管理段階とその障害の調査に焦点を当てています。これは、最終モデルの精度がモデルに供給されるデータの種類に依存するため、機械学習開発の最も重要な段階であるためです。
このステージで見つかった最大の障害は、特にデータが機密である分野において、モデル学習に十分なデータが不足していることでした。
このプロジェクトは、データ管理段階での十分なデータの不足を解決できる研究者と開発者向けのフレームワークを構築および開発することを目的としていました。
このフレームワークは、元のデータセットから新しいデータを生成するために使用できるいくつかのデータ拡張手法を利用しています。これにより、利用可能なデータの量と質を向上させてモデルに可能な限り最高のデータを供給することで、ML アプリケーションの全体的なパフォーマンスを向上させることができます。
このフレームワークは、深層学習の進歩を使用してデータ拡張を実行するために、Python 言語を使用して構築されました。
要約(オリジナル)
The purpose of this study is to investigate the development process for Artificial inelegance (AI) and machine learning (ML) applications in order to provide the best support environment. The main stages of ML are problem understanding, data management, model building, model deployment and maintenance. This project focuses on investigating the data management stage of ML development and its obstacles as it is the most important stage of machine learning development because the accuracy of the end model is relying on the kind of data fed into the model. The biggest obstacle found on this stage was the lack of sufficient data for model learning, especially in the fields where data is confidential. This project aimed to build and develop a framework for researchers and developers that can help solve the lack of sufficient data during data management stage. The framework utilizes several data augmentation techniques that can be used to generate new data from the original dataset which can improve the overall performance of the ML applications by increasing the quantity and quality of available data to feed the model with the best possible data. The framework was built using python language to perform data augmentation using deep learning advancements.
arxiv情報
著者 | Taha Khamis,Hamam Mokayed |
発行日 | 2023-08-15 08:15:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google