Deep Set Neural Networks for forecasting asynchronous bioprocess timeseries

要約

栽培実験では、スパースで不規則な時系列が生成されることが多い。最尤フィッティングやモンテカルロ・マルコフ連鎖サンプリングのようなメカニズムモデルに基づく古典的アプローチは、スパース性や時間グリッドの不規則性を容易に考慮することができるが、ほとんどの統計ツールや機械学習ツールは、そのままではスパースデータを扱うようには設計されていない。一般的なアプローチの中には、欠損値を埋める(インピュテーション)、規則的なグリッドに補間する(アラインメント)といった様々なスキームがある。しかし、このような方法は、補間モデルやインピュテーションモデルのバイアスをターゲットモデルに転送する。我々は、入力データのトリプレットエンコーディングを備えたディープセットニューラルネットワークが、インピュテーションやアライメントの手順を必要とせずに、バイオプロセスのデータをうまく扱えることを示す。本手法は、時系列の特定の性質にとらわれず、例えばオンラインモニタリング、予測制御、実験計画など、どのようなタスクにも適応可能である。本研究では予測に焦点を当てる。このようなアプローチは、典型的な栽培プロセスに特に適していることを論証し、現実的な条件下でのマクロ運動学的成長モデルから生成されたデータを用いて、いくつかの予測タスクに対する本手法の性能を実証し、従来のフィッティング手順や、インピュテーションやアライメントに基づく手法と本手法を比較する。

要約(オリジナル)

Cultivation experiments often produce sparse and irregular time series. Classical approaches based on mechanistic models, like Maximum Likelihood fitting or Monte-Carlo Markov chain sampling, can easily account for sparsity and time-grid irregularities, but most statistical and Machine Learning tools are not designed for handling sparse data out-of-the-box. Among popular approaches there are various schemes for filling missing values (imputation) and interpolation into a regular grid (alignment). However, such methods transfer the biases of the interpolation or imputation models to the target model. We show that Deep Set Neural Networks equipped with triplet encoding of the input data can successfully handle bio-process data without any need for imputation or alignment procedures. The method is agnostic to the particular nature of the time series and can be adapted for any task, for example, online monitoring, predictive control, design of experiments, etc. In this work, we focus on forecasting. We argue that such an approach is especially suitable for typical cultivation processes, demonstrate the performance of the method on several forecasting tasks using data generated from macrokinetic growth models under realistic conditions, and compare the method to a conventional fitting procedure and methods based on imputation and alignment.

arxiv情報

著者 Maxim Borisyak,Stefan Born,Peter Neubauer,Nicolás Cruz-Bournazou
発行日 2023-12-04 17:46:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG パーマリンク