Convolutional Motif Kernel Networks

要約

人工ニューラル ネットワークは、特定の結果に関連するデータ内の相関関係を検出する際に有望なパフォーマンスを示します。
しかし、そのようなモデルのブラックボックス的な性質は、意思決定プロセスを曖昧にし、科学者が予測される結果を完全に概念化することを妨げることにより、研究分野における知識の進歩を妨げる可能性があります。
さらに、医療提供者のような分野の専門家は、一か八かのシナリオで予測結果が信頼できるかどうかを評価し、モデルを独自のルーチンに統合するのに役立つ説明可能な予測を必要としています。
したがって、解釈可能なモデルは、医療のような一か八かのシナリオに機械学習を組み込むために重要な役割を果たします。
この論文では、畳み込みモチーフ カーネル ネットワークを紹介します。これは、位置認識モチーフ カーネル関数の再現カーネル ヒルベルト空間の部分空間内の特徴表現を学習することを含むニューラル ネットワーク アーキテクチャです。
結果として得られるモデルは、追加の事後分析を必要とせずに、生物学的および医学的に意味のある説明を提供することで、予測結果を直接解釈および評価することができます。
私たちのモデルが小規模なデータセットで堅牢に学習でき、関連する医療予測タスクで最先端のパフォーマンスに達することを示します。
私たちが提案した方法は、DNA およびタンパク質配列に対して利用できます。
さらに、提案された方法がエンドツーエンドの学習スキームを使用して、生物学的に意味のある概念をデータから直接学習することを示します。

要約(オリジナル)

Artificial neural networks show promising performance in detecting correlations within data that are associated with specific outcomes. However, the black-box nature of such models can hinder the knowledge advancement in research fields by obscuring the decision process and preventing scientist to fully conceptualize predicted outcomes. Furthermore, domain experts like healthcare providers need explainable predictions to assess whether a predicted outcome can be trusted in high stakes scenarios and to help them integrating a model into their own routine. Therefore, interpretable models play a crucial role for the incorporation of machine learning into high stakes scenarios like healthcare. In this paper we introduce Convolutional Motif Kernel Networks, a neural network architecture that involves learning a feature representation within a subspace of the reproducing kernel Hilbert space of the position-aware motif kernel function. The resulting model enables to directly interpret and evaluate prediction outcomes by providing a biologically and medically meaningful explanation without the need for additional post-hoc analysis. We show that our model is able to robustly learn on small datasets and reaches state-of-the-art performance on relevant healthcare prediction tasks. Our proposed method can be utilized on DNA and protein sequences. Furthermore, we show that the proposed method learns biologically meaningful concepts directly from data using an end-to-end learning scheme.

arxiv情報

著者 Jonas C. Ditz,Bernhard Reuter,Nico Pfeifer
発行日 2023-10-06 12:57:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク