On the Validation of Gibbs Algorithms: Training Datasets, Test Datasets and their Aggregation

要約

ギブス アルゴリズム (GA) のトレーニング データへの依存性は、分析的に特徴付けられます。
予想される経験的リスクをパフォーマンス指標として採用することにより、GA の感度が閉じた形式で取得されます。
この場合、感度は、任意の代替アルゴリズムに対するパフォーマンスの差です。
この記述により、さまざまなデータセットでトレーニングされた GA のトレーニング エラーとテスト エラーを含む明示的な式の開発が可能になります。
これらのツールを使用して、データセットの集約が研究され、GA の一般化機能を評価するためのさまざまな性能指数が導入されます。
このようなデータセットと GA のパラメーターの特定のサイズについては、Jeffrey の発散、トレーニング、およびテストのエラー間の関連性が確立されます。

要約(オリジナル)

The dependence on training data of the Gibbs algorithm (GA) is analytically characterized. By adopting the expected empirical risk as the performance metric, the sensitivity of the GA is obtained in closed form. In this case, sensitivity is the performance difference with respect to an arbitrary alternative algorithm. This description enables the development of explicit expressions involving the training errors and test errors of GAs trained with different datasets. Using these tools, dataset aggregation is studied and different figures of merit to evaluate the generalization capabilities of GAs are introduced. For particular sizes of such datasets and parameters of the GAs, a connection between Jeffrey’s divergence, training and test errors is established.

arxiv情報

著者 Samir M. Perlaza,Iñaki Esnaola,Gaetan Bisson,H. Vincent Poor
発行日 2023-06-21 16:51:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT, math.PR, math.ST, stat.TH パーマリンク