要約
ドメインのサブセットを介した時系列または画像データの集約は、データサイエンスの基本的なタスクです。
多くの既知の集約操作は、適切な(ダブル)カテゴリの(ダブル)ファンサーとして解釈できることを示しています。
このような機能的集約は、Blellochの並列スキャンアルゴリズムの簡単な拡張を介して並列実装に適しています。
既存の操作に関する統一された視点を提供することに加えて、時系列と画像データの新しい集約操作を提案することができます。
要約(オリジナル)
Aggregation of time-series or image data over subsets of the domain is a fundamental task in data science. We show that many known aggregation operations can be interpreted as (double) functors on appropriate (double) categories. Such functorial aggregations are amenable to parallel implementation via straightforward extensions of Blelloch’s parallel scan algorithm. In addition to providing a unified viewpoint on existing operations, it allows us to propose new aggregation operations for time-series and image data.
arxiv情報
著者 | Joscha Diehl |
発行日 | 2025-04-07 17:12:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google