TSPP: A Unified Benchmarking Tool for Time-series Forecasting

要約

最近、不正検出やレコメンダー システムなど、多くのタスクのためのディープ グラフ学習アルゴリズムの開発と導入に対する関心が高まっています。
ただし、公開されているグラフ構造のデータセットの数は限られており、そのほとんどは実稼働サイズのアプリケーションに比べて小さいか、アプリケーション ドメインが限られています。
この研究では、データセットを数兆のエッジと数十億のノードを含む運用サイズのグラフに拡張するためのスケーラブルな合成グラフ生成ツールを提案することで、この欠点に取り組んでいます。
このツールは独自のデータセットから一連のパラメトリック モデルを学習し、研究者に公開して合成データのさまざまなグラフ手法を研究し、プロトタイプの開発や新しいアプリケーションを増やすことができます。
一連のデータセットにわたるフレームワークの一般化可能性、構造分布と特徴分布を模倣すること、およびベンチマークとモデル開発での有用性を実証するさまざまなサイズにわたってそれらをスケーリングする機能を実証します。

要約(オリジナル)

Recently there has been increasing interest in developing and deploying deep graph learning algorithms for many tasks, such as fraud detection and recommender systems. Albeit, there is a limited number of publicly available graph-structured datasets, most of which are tiny compared to production-sized applications or are limited in their application domain. This work tackles this shortcoming by proposing a scalable synthetic graph generation tool to scale the datasets to production-size graphs with trillions of edges and billions of nodes. The tool learns a series of parametric models from proprietary datasets that can be released to researchers to study various graph methods on the synthetic data increasing prototype development and novel applications. We demonstrate the generalizability of the framework across a series of datasets, mimicking structural and feature distributions as well as the ability to scale them across varying sizes demonstrating their usefulness for benchmarking and model development.

arxiv情報

著者 Jan Bączek,Dmytro Zhylko,Gilberto Titericz,Sajad Darabi,Jean-Francois Puget,Izzy Putterman,Dawid Majchrowski,Anmol Gupta,Kyle Kranen,Pawel Morkisz
発行日 2023-12-28 16:23:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク