Multi-Modal Financial Time-Series Retrieval Through Latent Space Projections


これらのデータベースは、制約付き構造化照会言語 (SQL) に似た形式による時系列のインデックス作成とクエリをサポートし、「月次株価収益率が 5% を超える株」などの厳密な形式で表現されたクエリを可能にします。
ただし、このようなクエリでは、高次元の時系列データの本質的な複雑さは捉えられません。多くの場合、画像や言語でより適切に説明できます (例: 「低ボラティリティ体制にある株」)。
または金融時系列データのプロパティ (価格変動性など)。
さらに、私たちのアプローチにより、ユーザーフレンドリーなクエリ インターフェイスが可能になり、自然言語テキストや時系列のスケッチが可能になり、そのために直感的なインターフェイスを開発しました。
実際の履歴データと合成データの計算効率と精度の点でこの方法の利点を実証し、直感的なクエリ モダリティを使用した金融時系列データの保存と取得における潜在空間投影の有用性を強調します。


Financial firms commonly process and store billions of time-series data, generated continuously and at a high frequency. To support efficient data storage and retrieval, specialized time-series databases and systems have emerged. These databases support indexing and querying of time-series by a constrained Structured Query Language(SQL)-like format to enable queries like ‘Stocks with monthly price returns greater than 5%’, and expressed in rigid formats. However, such queries do not capture the intrinsic complexity of high dimensional time-series data, which can often be better described by images or language (e.g., ‘A stock in low volatility regime’). Moreover, the required storage, computational time, and retrieval complexity to search in the time-series space are often non-trivial. In this paper, we propose and demonstrate a framework to store multi-modal data for financial time-series in a lower-dimensional latent space using deep encoders, such that the latent space projections capture not only the time series trends but also other desirable information or properties of the financial time-series data (such as price volatility). Moreover, our approach allows user-friendly query interfaces, enabling natural language text or sketches of time-series, for which we have developed intuitive interfaces. We demonstrate the advantages of our method in terms of computational efficiency and accuracy on real historical data as well as synthetic data, and highlight the utility of latent-space projections in the storage and retrieval of financial time-series data with intuitive query modalities.


著者 Tom Bamford,Andrea Coletta,Elizabeth Fons,Sriram Gopalakrishnan,Svitlana Vyetrenko,Tucker Balch,Manuela Veloso
発行日 2024-01-02 10:18:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.HC, cs.LG パーマリンク