Subspace Aggregation Query and Index Generation for Multidimensional Resource Space Model

要約

多次元分類スペースでリソースを整理することは、大規模なリソースを効率的に管理しクエリするアプローチです。
このペーパーでは、各ディメンションの座標ツリーの部分順序の範囲で定義されたサブスペースの集約クエリを定義します。各ポイントには、ポイント上の部分順序関係の経路に沿って集約されたリソースが含まれているため、サブスペース内の各ポイントの集計リソースを測定、ランク付け、選択します。
大規模な部分空間で空白以外のポイントを効率的に見つけるために、グラフインデックスを生成するアプローチが提案され、ディメンションの座標に部分的な順序関係を持つ包含リンクを構築して、サブスペースクエリがスーパーポイントに戻るインデックスパスに沿ってインデックスリンクをフォローし、リソースを集計することにより空白のポイントに到達できるようにします。
このようなインデックスの生成は、インデックスノードの子供の数が非常に大きいため、インデックスングノードの総数がバウンドされていないため、コストがかかります。
提案されたアプローチは、コストを削減するための次の戦略を採用しています。(1)2つのインデックスノード間に交差リンクを追加すると、グラフインデックスのノードの数を制御しながらクエリ処理コストをより適切に削減できます。
(2)2つのノード間に交点を追加するコストを推定するために計算された確率分布に従って、2つのノード間に交差リンクが追加されます。
(3)より多くのリソースを持つ1つの次元での座標は、ノードのインデックス作成によって保持されるリソースの数のバランスをとるために、別の次元で座標によって分割されます。
(4)座標ツリーの兄弟座標間にショートカットリンクが追加され、線形順序座標で効率的なクエリを作成します。
分析と実験により、サブスペース集約クエリをサポートする際の生成されたインデックスの有効性が検証されました。
この作業は、多次元分類に基づいてデータモデルの開発に大きく貢献します。

要約(オリジナル)

Organizing resources in a multidimensional classification space is an approach to efficiently managing and querying large-scale resources. This paper defines an aggregation query on subspace defined by a range on the partial order on coordinate tree at each dimension, where each point contains resources aggregated along the paths of partial order relations on the points so that aggregated resources at each point within the subspace can be measured, ranked and selected. To efficiently locate non-empty points in a large subspace, an approach to generating graph index is proposed to build inclusion links with partial order relations on coordinates of dimensions to enable a subspace query to reach non-empty points by following indexing links and aggregate resources along indexing paths back to their super points. Generating such an index is costly as the number of children of an index node can be very large so that the total number of indexing nodes is unbounded. The proposed approach adopts the following strategies to reduce the cost: (1) adding intersection links between two indexing nodes, which can better reduce query processing costs while controlling the number of nodes of the graph index; (2) intersection links are added between two nodes according to the probabilistic distribution calculated for estimating the costs of adding intersection between two nodes; (3) coordinates at one dimension having more resources are split by coordinates at another dimension to balance the number of resources hold by indexing nodes; and, (4) short-cut links are added between sibling coordinates of coordinate trees to make an efficient query on linear order coordinates. Analysis and experiments verified the effectiveness of the generated index in supporting subspace aggregation query. This work makes significant contributions to the development of data model based on multi-dimensional classification.

arxiv情報

著者 Xiaoping Sun,Hai Zhuge
発行日 2025-05-09 10:17:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB パーマリンク