Diffusion Transformers for Tabular Data Time Series Generation

要約

表形式のデータ生成は、アプリケーションのシナリオが異なるため、最近、関心が高まっています。
ただし、シリーズの各要素が他の要素に依存している合計データの時系列を生成することは、ほとんど未踏のドメインのままです。
このギャップは、おそらく異なる問題を共同で解決することの難しさによるものであり、その主なものは表形式データの不均一性(非時間依存的アプローチに共通する問題)と時系列の変動長です。
この論文では、表形式のデータ系列生成のための拡散トランス(DITS)ベースのアプローチを提案します。
画像とビデオの生成におけるDITの最近の成功に触発されて、このフレームワークを拡張して、不均一なデータと可変長シーケンスに対処します。
6つのデータセットでの広範な実験を使用して、提案されたアプローチが以前の作業を大きなマージンで上回ることを示しています。

要約(オリジナル)

Tabular data generation has recently attracted a growing interest due to its different application scenarios. However, generating time series of tabular data, where each element of the series depends on the others, remains a largely unexplored domain. This gap is probably due to the difficulty of jointly solving different problems, the main of which are the heterogeneity of tabular data (a problem common to non-time-dependent approaches) and the variable length of a time series. In this paper, we propose a Diffusion Transformers (DiTs) based approach for tabular data series generation. Inspired by the recent success of DiTs in image and video generation, we extend this framework to deal with heterogeneous data and variable-length sequences. Using extensive experiments on six datasets, we show that the proposed approach outperforms previous work by a large margin.

arxiv情報

著者 Fabrizio Garuti,Enver Sangineto,Simone Luetto,Lorenzo Forni,Rita Cucchiara
発行日 2025-04-18 12:55:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク