Defining data science: a new field of inquiry

要約

データサイエンスは科学ではありません。
それは研究パラダイムです。
その力、範囲、規模は、私たちの最も強力な研究パラダイムである科学を超え、知識の発見を可能にし、世界を変えるでしょう。
私たちは、その可能性を実現し、そのリスクを管理するために不可欠であるそれを理解して定義することがまだできていません。
現代のデータサイエンスはまだ初期段階にあります。
1962 年からゆっくりと、2000 年から急速に出現したこの研究は、根本的に新しい研究分野であり、最も活発で強力で、急速に進化している 21 世紀のイノベーションの 1 つです。
その価値、威力、応用性により、40 以上の分野、数百の研究分野、数千の応用分野で活用されています。
何百万ものデータ サイエンスの出版物には、データ サイエンスとデータ サイエンスの問題解決に関する無数の定義が含まれています。
まだ初期段階にあるため、多くの定義は独立しており、アプリケーション固有であり、相互に不完全、冗長、または一貫性がありません。したがって、データ サイエンスも同様です。
この研究では、データ サイエンス コミュニティがそのような定義を達成するために、データ サイエンス ジャーナルを使用したデータ サイエンス参照フレームワークに基づく一貫した統一された定義の開発を提案することで、このデータ サイエンスの複数の定義の課題に対処します。
このペーパーでは、そのような定義を議論するために必要な、重要なデータ サイエンス成果物の定義の候補を示します。
これらは、データ サイエンスの哲学、データ サイエンスの問題解決パラダイム、およびデータ サイエンスを定義、統一、進化させるための統一フレームワークが頻繁に求められる 6 つの構成要素であるデータ サイエンス参照フレームワーク (公理論、オントロジー、認識論、方法論、手法、テクノロジー) で構成される古典的な研究パラダイムの概念に基づいています。
データ サイエンスを定義するための課題、ソリューション アプローチ、つまりデータ サイエンスを定義する手段、および包括的なソリューションの基礎としてのその要件と利点を示します。

要約(オリジナル)

Data science is not a science. It is a research paradigm. Its power, scope, and scale will surpass science, our most powerful research paradigm, to enable knowledge discovery and change our world. We have yet to understand and define it, vital to realizing its potential and managing its risks. Modern data science is in its infancy. Emerging slowly since 1962 and rapidly since 2000, it is a fundamentally new field of inquiry, one of the most active, powerful, and rapidly evolving 21st century innovations. Due to its value, power, and applicability, it is emerging in over 40 disciplines, hundreds of research areas, and thousands of applications. Millions of data science publications contain myriad definitions of data science and data science problem solving. Due to its infancy, many definitions are independent, application specific, mutually incomplete, redundant, or inconsistent, hence so is data science. This research addresses this data science multiple definitions challenge by proposing the development of coherent, unified definition based on a data science reference framework using a data science journal for the data science community to achieve such a definition. This paper provides candidate definitions for essential data science artifacts that are required to discuss such a definition. They are based on the classical research paradigm concept consisting of a philosophy of data science, the data science problem solving paradigm, and the six component data science reference framework (axiology, ontology, epistemology, methodology, methods, technology) that is a frequently called for unifying framework with which to define, unify, and evolve data science. It presents challenges for defining data science, solution approaches, i.e., means for defining data science, and their requirements and benefits as the basis of a comprehensive solution.

arxiv情報

著者 Michael L Brodie
発行日 2023-07-24 12:32:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LG, I.2 パーマリンク