要約
本稿では、信号の特徴をクエリとして記述する自然言語を用いて時系列信号を検索できる基盤モデル「CLaSP」を提案する。
時系列信号データを自然言語で表現するこれまでの取り組みでは、従来のクラスの時系列信号特性の設計、定量化の定式化、同義語辞書の作成に課題がありました。
これらの制限を克服するために、提案された方法では対照学習に基づくニューラル ネットワークを導入します。
このネットワークは、時系列信号とそれに対応する自然言語記述で構成されるデータセット TRUCE と SUSHI を使用して最初にトレーニングされます。
これまでの研究では、データ アナリストが信号の特性を説明するために使用する語彙が提案されており、SUSHI はこれらの用語をカバーするように設計されました。
これらのデータセットでトレーニングされたニューラル ネットワークにより、データ アナリストが自然言語語彙を使用して検索できるようになると私たちは考えています。
さらに、私たちの方法は事前定義された同義語の辞書を必要とせず、大規模言語モデル (LLM) に組み込まれた常識の知識を活用します。
実験結果は、CLaSP が時系列信号データの自然言語検索を可能にし、信号データの変化点を正確に学習できることを示しています。
要約(オリジナル)
This paper proposes a foundation model called ‘CLaSP’ that can search time series signals using natural language that describes the characteristics of the signals as queries. Previous efforts to represent time series signal data in natural language have had challenges in designing a conventional class of time series signal characteristics, formulating their quantification, and creating a dictionary of synonyms. To overcome these limitations, the proposed method introduces a neural network based on contrastive learning. This network is first trained using the datasets TRUCE and SUSHI, which consist of time series signals and their corresponding natural language descriptions. Previous studies have proposed vocabularies that data analysts use to describe signal characteristics, and SUSHI was designed to cover these terms. We believe that a neural network trained on these datasets will enable data analysts to search using natural language vocabulary. Furthermore, our method does not require a dictionary of predefined synonyms, and it leverages common sense knowledge embedded in a large-scale language model (LLM). Experimental results demonstrate that CLaSP enables natural language search of time series signal data and can accurately learn the points at which signal data changes.
arxiv情報
著者 | Aoi Ito,Kota Dohi,Yohei Kawaguchi |
発行日 | 2024-11-13 07:32:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google