Industry Classification Using a Novel Financial Time-Series Case Representation



– 金融分野は、予測、クラスタリング、分類を含むさまざまなタスクにおいて、機械学習の課題を提供することができる。
– 時系列データが豊富であり、わずかな性能向上でも大きな追加価値につながる。
– 本研究では、歴史的な株式リターンの時系列データを使用して、産業セクターの分類における重要なタスクに対して、ケースベース推論の使用を考慮している。
– 時系列データは従来のケースベース推論の手法において、重要な表現上の課題を示すことができることを議論し、応答として、株式リターンの埋め込みに基づく新しい表現を提案する。
– この表現は、生の株式リターンデータから簡単に計算できるため、ケースベース推論に適していると主張し、業界セクター分類タスクの大規模な公開データセットを使用して、従来の表現よりも大幅な性能向上を実証する。


The financial domain has proven to be a fertile source of challenging machine learning problems across a variety of tasks including prediction, clustering, and classification. Researchers can access an abundance of time-series data and even modest performance improvements can be translated into significant additional value. In this work, we consider the use of case-based reasoning for an important task in this domain, by using historical stock returns time-series data for industry sector classification. We discuss why time-series data can present some significant representational challenges for conventional case-based reasoning approaches, and in response, we propose a novel representation based on stock returns embeddings, which can be readily calculated from raw stock returns data. We argue that this representation is well suited to case-based reasoning and evaluate our approach using a large-scale public dataset for the industry sector classification task, demonstrating substantial performance improvements over several baselines using more conventional representations.


著者 Rian Dolphin,Barry Smyth,Ruihai Dong
発行日 2023-04-29 12:06:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.LG, q-fin.ST パーマリンク