Iterative Forgetting: Online Data Stream Regression Using Database-Inspired Adaptive Granulation

要約

金融、交通、電気通信システムなどの多くの現代システムは、リアルタイムの意思決定のために低遅延の予測を必要とするという意味で時間に敏感です。
このようなシステムは、多くの場合、連続的な無制限のデータ ストリームやコンセプト ドリフトに対処する必要があり、これは従来の回帰手法では対応できない困難な要件です。
これらのシナリオを処理できる新しいデータ ストリーム回帰メソッドを作成する必要があります。
データベースにヒントを得たデータストリーム回帰モデルを提示します。このモデルでは、(a) R* ツリーからのインスピレーションを使用して、関連情報が保持されるように受信データストリームからグラニュールを作成します。(b) 情報が古いと思われるグラニュールを繰り返し忘れて、
最近の関連するグラニュールのみのリスト、および (c) 最近のデータとグラニュールを使用して、低レイテンシの予測を提供します。
R* ツリーにヒントを得たアプローチにより、アルゴリズムはデータベース システムとの統合にも適しています。
私たちの実験では、この方法のデータ破棄機能により、最も正確な最先端のアルゴリズムと比較して評価した場合、レイテンシとトレーニング時間が大幅に改善されることが実証されました。
技術により、競争力のある正確な予測が可能になります

要約(オリジナル)

Many modern systems, such as financial, transportation, and telecommunications systems, are time-sensitive in the sense that they demand low-latency predictions for real-time decision-making. Such systems often have to contend with continuous unbounded data streams as well as concept drift, which are challenging requirements that traditional regression techniques are unable to cater to. There exists a need to create novel data stream regression methods that can handle these scenarios. We present a database-inspired datastream regression model that (a) uses inspiration from R*-trees to create granules from incoming datastreams such that relevant information is retained, (b) iteratively forgets granules whose information is deemed to be outdated, thus maintaining a list of only recent, relevant granules, and (c) uses the recent data and granules to provide low-latency predictions. The R*-tree-inspired approach also makes the algorithm amenable to integration with database systems. Our experiments demonstrate that the ability of this method to discard data produces a significant order-of-magnitude improvement in latency and training time when evaluated against the most accurate state-of-the-art algorithms, while the R*-tree-inspired granulation technique provides competitively accurate predictions

arxiv情報

著者 Niket Kathiriya,Hossein Haeri,Cindy Chen,Kshitij Jerath
発行日 2024-03-14 17:26:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DB, cs.LG パーマリンク