SeFNet: Bridging Tabular Datasets with Semantic Feature Nets

要約

機械学習アプリケーションは、表形式のデータセットが重要な役割を果たす幅広い予測タスクをカバーします。
ただし、表形式のデータセットは同様の問題に対処することがよくありますが、通常はスタンドアロン タスクとして扱われます。
以前に解決された問題を使用する可能性は、その機能に関する構造化されたコンテキスト情報が不足しており、それらの問題間の関係が理解されていないため、制限されています。
この制限を克服するために、分析された表形式の特徴の意味論的な意味を捉える、Semantic Feature Net (SeFNet) と呼ばれる新しいアプローチを提案します。
SeFNet は、既存のオントロジーとドメインの知識を活用することで、多様な予測タスク間で洞察を共有する新しい機会を開きます。
そのような機会の 1 つは、データセット オントロジー ベースのセマンティック類似性 (DOSS) 測定です。これは、特徴間の関係を使用してデータセット間の類似性を定量化します。
この論文では、SNOMED-CT オントロジーから導出された特徴の関係を使用して、ヘルスケアにおける予測タスクのコレクション用に準備された SeFNet の例を紹介します。
提案された SeFNet フレームワークとそれに付随する DOSS 対策は、表形式のデータセット内の限定されたコンテキスト情報の問題に対処します。
ドメイン知識を組み込み、機能間のセマンティックな関係を確立することで、メタ学習の可能性が高まり、さまざまな予測タスク間で貴重な洞察を共有できるようになります。

要約(オリジナル)

Machine learning applications cover a wide range of predictive tasks in which tabular datasets play a significant role. However, although they often address similar problems, tabular datasets are typically treated as standalone tasks. The possibilities of using previously solved problems are limited due to the lack of structured contextual information about their features and the lack of understanding of the relations between them. To overcome this limitation, we propose a new approach called Semantic Feature Net (SeFNet), capturing the semantic meaning of the analyzed tabular features. By leveraging existing ontologies and domain knowledge, SeFNet opens up new opportunities for sharing insights between diverse predictive tasks. One such opportunity is the Dataset Ontology-based Semantic Similarity (DOSS) measure, which quantifies the similarity between datasets using relations across their features. In this paper, we present an example of SeFNet prepared for a collection of predictive tasks in healthcare, with the features’ relations derived from the SNOMED-CT ontology. The proposed SeFNet framework and the accompanying DOSS measure address the issue of limited contextual information in tabular datasets. By incorporating domain knowledge and establishing semantic relations between features, we enhance the potential for meta-learning and enable valuable insights to be shared across different predictive tasks.

arxiv情報

著者 Katarzyna Woźnica,Piotr Wilczyński,Przemysław Biecek
発行日 2023-06-20 16:02:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク