CS4ML: A general framework for active learning with arbitrary data based on Christoffel functions

要約

回帰問題におけるアクティブラーニングの一般的なフレームワークを紹介します。
私たちのフレームワークは、ターゲット関数の単なる点単位のサンプルではなく、一般的なタイプのデータを許可することで標準設定を拡張します。
この一般化は、変換領域で取得されたデータ (フーリエ データなど)、ベクトル値データ (勾配拡張データなど)、連続曲線に沿って取得されたデータ、およびマルチモーダル データ (つまり、組み合わせなど) など、実際に興味深い多くのケースをカバーしています。
さまざまなタイプの測定)。
私たちのフレームワークは、有限数のサンプリング測定と任意の非線形近似空間 (モデル クラス) に従ったランダム サンプリングを考慮します。
一般化されたクリストッフェル関数の概念を導入し、これらを使用してサンプリング測定を最適化する方法を示します。
これにより、さまざまな重要なケースで最適に近いサンプルの複雑さが得られることを証明します。
この論文では、科学計算におけるアプリケーションに焦点を当てます。科学計算では、通常、データの生成に費用がかかるため、アクティブ ラーニングが望ましいことがよくあります。
多項式を使用した勾配拡張学習、生成モデルを使用した磁気共鳴画像法 (MRI)、および物理情報に基づくニューラル ネットワーク (PINN) を使用して偏微分方程式を解くための適応サンプリングに対するフレームワークの有効性を実証します。

要約(オリジナル)

We introduce a general framework for active learning in regression problems. Our framework extends the standard setup by allowing for general types of data, rather than merely pointwise samples of the target function. This generalization covers many cases of practical interest, such as data acquired in transform domains (e.g., Fourier data), vector-valued data (e.g., gradient-augmented data), data acquired along continuous curves, and, multimodal data (i.e., combinations of different types of measurements). Our framework considers random sampling according to a finite number of sampling measures and arbitrary nonlinear approximation spaces (model classes). We introduce the concept of generalized Christoffel functions and show how these can be used to optimize the sampling measures. We prove that this leads to near-optimal sample complexity in various important cases. This paper focuses on applications in scientific computing, where active learning is often desirable, since it is usually expensive to generate data. We demonstrate the efficacy of our framework for gradient-augmented learning with polynomials, Magnetic Resonance Imaging (MRI) using generative models and adaptive sampling for solving PDEs using Physics-Informed Neural Networks (PINNs).

arxiv情報

著者 Ben Adcock,Juan M. Cardenas,Nick Dexter
発行日 2023-06-01 17:44:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NA, math.NA パーマリンク