Towards machine learning guided by best practices



– 機械学習は医療からソフトウェアエンジニアリングまで多様な分野で利用されている。
– 産業における機械学習の普及度は増加しており、ソフトウェアエンジニアリングのコンファレンスやジャーナルに多数の研究が発表されるなど、研究分野でも普及している。
– しかし、機械学習には特定の課題や障害が存在することが明らかになっている。
– これまでの研究では、従来のソフトウェアエンジニアリングとは異なる開発プロセスを持つことが示されており、機械学習アプリケーションの課題も明示されている。
– 白書やグレー文献には、特定のドメイン(例えば生体力学)に基づいた提言が存在するが、ソフトウェアエンジニアリングコミュニティにフォーカスした指針は存在しない。
– 本論文は、質問と回答のコミュニティなどの情報源を分析し、ソフトウェアエンジニアリングの観点から具体的なプラクティスを提示することで、開発者や研究者が共有する実践について理解するための研究質問に答えることを目的としている。


Nowadays, machine learning (ML) is being used in software systems with multiple application fields, from medicine to software engineering (SE). On the one hand, the popularity of ML in the industry can be seen in the statistics showing its growth and adoption. On the other hand, its popularity can also be seen in research, particularly in SE, where not only have multiple studies been published in SE conferences and journals but also in the multiple workshops and co-located conferences in software engineering conferences. At the same time, researchers and practitioners have shown that machine learning has some particular challenges and pitfalls. In particular, research has shown that ML-enabled systems have a different development process than traditional SE, which also describes some of the challenges of ML applications. In order to mitigate some of the identified challenges and pitfalls, white and gray literature has proposed a set of recommendations based on their own experiences and focused on their domain (e.g., biomechanics), but for the best of our knowledge, there is no guideline focused on the SE community. This thesis aims to reduce this gap by answering research questions that help to understand the practices used and discussed by practitioners and researchers in the SE community by analyzing possible sources of practices such as question and answer communities and also previous research studies to present a set of practices with an SE perspective.


著者 Anamaria Mojica-Hanke
発行日 2023-04-29 10:58:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.SE パーマリンク