要約
メジャーツーメジャーマッピングの学習は、機械学習における重要なタスクであり、生成モデリングで顕著に取り上げられます。
近年、最適輸送 (OT) 理論からインスピレーションを得た技術が急増しています。
ニューラル ネットワーク モデルと組み合わせて、\textit{Neural OT} として総称されるこれらのメソッドは、誘導バイアスとして最適なトランスポートを使用します。そのようなマッピングは、全体的に最適である必要があります。
特定のコスト関数。つまり、空間内 (変位を最小限に抑えることによって) または空間全体 (等尺性であることによって) でポイントを効率的に移動できるという意味です。
この原理は直観的ではありますが、OT ツールボックスの適応を必要とするいくつかの実際的な課題に直面することがよくあります。2 乗ユークリッド コスト以外のコスト関数は処理が難しい場合があり、モンジュ マップの決定論的な定式化には柔軟性がほとんど残されておらず、比較できない空間にわたるマッピングでは問題が発生します。
一方で、OT に固有の質量保存制約により、異常値が過大に評価される可能性があります。
実践と理論の間のこれらの不一致のそれぞれは、さまざまな研究で独立して対処されてきましたが、この研究では、\textit{生成エントロピック神経最適輸送} (GENOT) と呼ばれる、それらを統合するエレガントなフレームワークを提案します。
GENOT はあらゆるコスト関数に対応できます。
条件付き生成モデルを使用してランダム性を処理します。
比較できない空間全体に点をマッピングでき、\textit{unbalance} ソルバーとして使用できます。
私たちは、さまざまな合成データセットに対して行われた実験を通じてアプローチを評価し、単細胞生物学におけるその実用性を実証します。
この分野では、GENOT は、細胞発生のモデリング、薬物に対する細胞反応の予測、細胞の異なるデータ モダリティ間の変換などのタスクに価値があることが証明されています。
要約(オリジナル)
Learning measure-to-measure mappings is a crucial task in machine learning, featured prominently in generative modeling. Recent years have witnessed a surge of techniques that draw inspiration from optimal transport (OT) theory. Combined with neural network models, these methods collectively known as \textit{Neural OT} use optimal transport as an inductive bias: such mappings should be optimal w.r.t. a given cost function, in the sense that they are able to move points in a thrifty way, within (by minimizing displacements) or across spaces (by being isometric). This principle, while intuitive, is often confronted with several practical challenges that require adapting the OT toolbox: cost functions other than the squared-Euclidean cost can be challenging to handle, the deterministic formulation of Monge maps leaves little flexibility, mapping across incomparable spaces raises multiple challenges, while the mass conservation constraint inherent to OT can provide too much credit to outliers. While each of these mismatches between practice and theory has been addressed independently in various works, we propose in this work an elegant framework to unify them, called \textit{generative entropic neural optimal transport} (GENOT). GENOT can accommodate any cost function; handles randomness using conditional generative models; can map points across incomparable spaces, and can be used as an \textit{unbalanced} solver. We evaluate our approach through experiments conducted on various synthetic datasets and demonstrate its practicality in single-cell biology. In this domain, GENOT proves to be valuable for tasks such as modeling cell development, predicting cellular responses to drugs, and translating between different data modalities of cells.
arxiv情報
著者 | Dominik Klein,Théo Uscidda,Fabian Theis,Marco Cuturi |
発行日 | 2023-10-13 17:12:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google