Online Epsilon Net and Piercing Set for Geometric Concepts

要約

VC 次元と $\varepsilon$-nets は、統計的学習理論の重要な概念です。
直観的には、VC 次元はセットのクラスのサイズの尺度です。
離散幾何学の基本的な結果である有名な $\varepsilon$-net 定理は、集合系の VC 次元が有界である場合、十分に大きな集合すべてと交差する小さなサンプルが存在すると主張します。
データが順次到着するオンライン学習シナリオでは、VC 次元は集合システムの複雑さを制限するのに役立ち、$\varepsilon$-nets は小さな代表的な集合の選択を保証します。
このサンプリング フレームワークは、空間データ分析、動的環境での動作計画、センサー ネットワークの最適化、コンピューター ビジョンでの特徴抽出など、さまざまな分野で重要です。
これらの応用を動機として、私たちは有界 VC 次元を持つ幾何学的概念に対するオンライン $\varepsilon$-net 問題を研究します。
この問題のオフライン バージョンについては広く研究されていますが、驚くべきことに、オンライン バージョンに関する理論的な結果は現在まで知られていません。
$\mathbb{R}$ の区間に最適な競争率を備えた最初の決定論的オンライン アルゴリズムを提示します。
次に、$\mathbb{R}^d$、$d\le 3$ の軸に整列したボックスに対して最適に近い競合比を持つランダム化オンライン アルゴリズムを与えます。
さらに、$\mathbb{R}^d$ で一定の​​記述複雑さを持つ同様のサイズのオブジェクトを分析するための新しい手法を紹介します。これは独立した興味深いものになる可能性があります。
次に、この問題の連続バージョンに焦点を当てます。この問題では、集合系の範囲はオンライン形式で到達する $\mathbb{R}^d$ の幾何学的概念ですが、宇宙は空間全体であり、目的は
すべての範囲と交差する小さなサンプルを選択します。

要約(オリジナル)

VC-dimension and $\varepsilon$-nets are key concepts in Statistical Learning Theory. Intuitively, VC-dimension is a measure of the size of a class of sets. The famous $\varepsilon$-net theorem, a fundamental result in Discrete Geometry, asserts that if the VC-dimension of a set system is bounded, then a small sample exists that intersects all sufficiently large sets. In online learning scenarios where data arrives sequentially, the VC-dimension helps to bound the complexity of the set system, and $\varepsilon$-nets ensure the selection of a small representative set. This sampling framework is crucial in various domains, including spatial data analysis, motion planning in dynamic environments, optimization of sensor networks, and feature extraction in computer vision, among others. Motivated by these applications, we study the online $\varepsilon$-net problem for geometric concepts with bounded VC-dimension. While the offline version of this problem has been extensively studied, surprisingly, there are no known theoretical results for the online version to date. We present the first deterministic online algorithm with an optimal competitive ratio for intervals in $\mathbb{R}$. Next, we give a randomized online algorithm with a near-optimal competitive ratio for axis-aligned boxes in $\mathbb{R}^d$, for $d\le 3$. Furthermore, we introduce a novel technique to analyze similar-sized objects of constant description complexity in $\mathbb{R}^d$, which may be of independent interest. Next, we focus on the continuous version of this problem, where ranges of the set system are geometric concepts in $\mathbb{R}^d$ arriving in an online manner, but the universe is the entire space, and the objective is to choose a small sample that intersects all the ranges.

arxiv情報

著者 Sujoy Bhore,Devdan Dey,Satyam Singh
発行日 2024-10-09 16:58:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.LG パーマリンク