On the Relation Between Autoencoders and Non-negative Matrix Factorization, and Their Application for Mutational Signature Extraction

要約

この研究の目的は、非負行列因数分解 (NMF) と非負オートエンコーダの関係を理解するための基盤を提供し、NMF に代わるオートエンコーダベースの代替手段の適切な解釈と理解を可能にすることです。
NMF は、その導入以来、高次元データの解釈可能な低次元表現を抽出するための人気のあるツールです。
しかし、最近、いくつかの研究が NMF をオートエンコーダに置き換えることを提案しています。
オートエンコーダの人気が高まっているため、この置き換えが一般的に有効かつ合理的であるかどうかを調査する必要があります。
さらに、非負のオートエンコーダと NMF の間の正確な関係は完全には調査されていません。
したがって、この研究の主な目的は、非ネガティブ オートエンコーダーと NMF の関係を詳細に調査することです。
2 つのモデル間の接続は、NMF の限定されたケースである凸 NMF を通じて確立できることがわかりました。
特に、凸 NMF はオートエンコーダーの特殊なケースです。
NMF とオートエンコーダーのパフォーマンスは、がんゲノミクス データからの突然変異シグネチャの抽出というコンテキスト内で比較されます。
NMF に基づく再構成はオートエンコーダーと比較してより正確である一方、両方の方法を使用して抽出された署名は、外部で検証された場合に同等の一貫性と値を示すことがわかりました。
これらの発見は、この記事で調査した非ネガティブ オートエンコーダーが、変異シグネチャ抽出の分野における NMF の改善を提供しないことを示唆しています。

要約(オリジナル)

The aim of this study is to provide a foundation to understand the relationship between non-negative matrix factorization (NMF) and non-negative autoencoders enabling proper interpretation and understanding of autoencoder-based alternatives to NMF. Since its introduction, NMF has been a popular tool for extracting interpretable, low-dimensional representations of high-dimensional data. However, recently, several studies have proposed to replace NMF with autoencoders. This increasing popularity of autoencoders warrants an investigation on whether this replacement is in general valid and reasonable. Moreover, the exact relationship between non-negative autoencoders and NMF has not been thoroughly explored. Thus, a main aim of this study is to investigate in detail the relationship between non-negative autoencoders and NMF. We find that the connection between the two models can be established through convex NMF, which is a restricted case of NMF. In particular, convex NMF is a special case of an autoencoder. The performance of NMF and autoencoders is compared within the context of extraction of mutational signatures from cancer genomics data. We find that the reconstructions based on NMF are more accurate compared to autoencoders, while the signatures extracted using both methods show comparable consistencies and values when externally validated. These findings suggest that the non-negative autoencoders investigated in this article do not provide an improvement of NMF in the field of mutational signature extraction.

arxiv情報

著者 Ida Egendal,Rasmus Froberg Brøndum,Marta Pelizzola,Asger Hobolth,Martin Bøgsted
発行日 2024-05-13 16:09:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP パーマリンク