Hilbert curves for efficient exploratory landscape analysis neighbourhood sampling

要約

ランドスケープ解析は、目的(またはフィットネス)関数のランドスケー プ特性に基づいて最適化問題を特徴付けることを目的としている。通常、問題の探索空間はサンプリングされ、そのサンプルに基づいて様々なランドスケープの特徴が推定される。特に重要な特徴の1つは情報量であり、これは、連続するサンプル点間の局所的な関係が保たれるように、サンプルが隣接する解のシーケンスであることを必要とします。このような空間的に相関のあるサンプルを生成し、かつ探索空間を良好にカバーすることは困難である。そのため、まず良好な探索空間をカバーする順序のないサンプルを取得し、次にサンプル内の連続する点間の距離を最小化するために最近傍アルゴリズムなどの順序付けアルゴリズムを適用するのが一般的です。しかし、最近傍アルゴリズムは高次元では計算量が膨大になるため、より効率的な代替アルゴリズムが必要となる。本研究では、高品質な順序付きサンプルを効率的に得る方法として、ヒルベルト空間充填曲線を提案する。ヒルベルト曲線はフラクタル曲線の特殊な場合であり、空間的に相関のあるサンプルを提供しながら、境界のある探索空間の均一な被覆を保証する。我々は、サンプラーとしてのヒルベルト曲線の有効性を研究し、ラテン超立方体サンプリングによるポストファクタム順序付けと比較して、わずかな計算コストで顕著な特徴を抽出できることを発見した。さらに、順序付け戦略としてのヒルベルト曲線の利用を調査し、抽出された特徴の顕著性を犠牲にすることなく、最近傍順序付けよりも有意に高速にサンプルを順序付けることを発見する。

要約(オリジナル)

Landscape analysis aims to characterise optimisation problems based on their objective (or fitness) function landscape properties. The problem search space is typically sampled, and various landscape features are estimated based on the samples. One particularly salient set of features is information content, which requires the samples to be sequences of neighbouring solutions, such that the local relationships between consecutive sample points are preserved. Generating such spatially correlated samples that also provide good search space coverage is challenging. It is therefore common to first obtain an unordered sample with good search space coverage, and then apply an ordering algorithm such as the nearest neighbour to minimise the distance between consecutive points in the sample. However, the nearest neighbour algorithm becomes computationally prohibitive in higher dimensions, thus there is a need for more efficient alternatives. In this study, Hilbert space-filling curves are proposed as a method to efficiently obtain high-quality ordered samples. Hilbert curves are a special case of fractal curves, and guarantee uniform coverage of a bounded search space while providing a spatially correlated sample. We study the effectiveness of Hilbert curves as samplers, and discover that they are capable of extracting salient features at a fraction of the computational cost compared to Latin hypercube sampling with post-factum ordering. Further, we investigate the use of Hilbert curves as an ordering strategy, and find that they order the sample significantly faster than the nearest neighbour ordering, without sacrificing the saliency of the extracted features.

arxiv情報

著者 Johannes J. Pienaar,Anna S. Bosman,Katherine M. Malan
発行日 2024-08-01 12:57:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.NE パーマリンク