Multi-Modal Financial Time-Series Retrieval Through Latent Space Projections

要約

金融会社は通常、継続的かつ高頻度で生成される数十億件の時系列データを処理し、保存します。
効率的なデータの保存と取得をサポートするために、特化された時系列データベースとシステムが登場しました。
これらのデータベースは、制約付き構造化照会言語 (SQL) に似た形式による時系列のインデックス作成とクエリをサポートし、「月次株価収益率が 5% を超える株」などの厳密な形式で表現されたクエリを可能にします。
ただし、このようなクエリでは、高次元の時系列データの本質的な複雑さは捉えられません。多くの場合、画像や言語でより適切に説明できます (例: 「低ボラティリティ体制にある株」)。
さらに、時系列空間での検索に必要なストレージ、計算時間、検索の複雑さは、多くの場合、重要です。
この論文では、ディープエンコーダを使用して、金融時系列のマルチモーダルデータを低次元の潜在空間に保存するフレームワークを提案し、実証します。これにより、潜在空間投影が時系列の傾向だけでなく、他の望ましい情報も捕捉できるようになります。
または金融時系列データのプロパティ (価格変動性など)。
さらに、私たちのアプローチにより、ユーザーフレンドリーなクエリ インターフェイスが可能になり、自然言語テキストや時系列のスケッチが可能になり、そのために直感的なインターフェイスを開発しました。
実際の履歴データと合成データの計算効率と精度の点でこの方法の利点を実証し、直感的なクエリ モダリティを使用した金融時系列データの保存と取得における潜在空間投影の有用性を強調します。

要約(オリジナル)

Financial firms commonly process and store billions of time-series data, generated continuously and at a high frequency. To support efficient data storage and retrieval, specialized time-series databases and systems have emerged. These databases support indexing and querying of time-series by a constrained Structured Query Language(SQL)-like format to enable queries like ‘Stocks with monthly price returns greater than 5%’, and expressed in rigid formats. However, such queries do not capture the intrinsic complexity of high dimensional time-series data, which can often be better described by images or language (e.g., ‘A stock in low volatility regime’). Moreover, the required storage, computational time, and retrieval complexity to search in the time-series space are often non-trivial. In this paper, we propose and demonstrate a framework to store multi-modal data for financial time-series in a lower-dimensional latent space using deep encoders, such that the latent space projections capture not only the time series trends but also other desirable information or properties of the financial time-series data (such as price volatility). Moreover, our approach allows user-friendly query interfaces, enabling natural language text or sketches of time-series, for which we have developed intuitive interfaces. We demonstrate the advantages of our method in terms of computational efficiency and accuracy on real historical data as well as synthetic data, and highlight the utility of latent-space projections in the storage and retrieval of financial time-series data with intuitive query modalities.

arxiv情報

著者 Tom Bamford,Andrea Coletta,Elizabeth Fons,Sriram Gopalakrishnan,Svitlana Vyetrenko,Tucker Balch,Manuela Veloso
発行日 2024-01-02 10:18:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.LG パーマリンク