Accelerating Machine Learning Algorithms with Adaptive Sampling

要約

膨大なデータの時代には、高効率の機械学習アルゴリズムが必要です。
ただし、一般的な機械学習アルゴリズムの多くは、大規模なデータセットでは法外に高価な計算集約型のサブルーチンに依存しています。
多くの場合、既存の手法では、データをサブサンプリングするか、他の方法を使用して計算効率を向上させますが、その代わりに近似誤差が発生します。
この論文は、多くの場合、計算集約的なサブルーチンを、品質をほとんど低下させない特別な種類のランダム化されたサブルーチンで置き換えることで十分であることを示しています。

要約(オリジナル)

The era of huge data necessitates highly efficient machine learning algorithms. Many common machine learning algorithms, however, rely on computationally intensive subroutines that are prohibitively expensive on large datasets. Oftentimes, existing techniques subsample the data or use other methods to improve computational efficiency, at the expense of incurring some approximation error. This thesis demonstrates that it is often sufficient, instead, to substitute computationally intensive subroutines with a special kind of randomized counterparts that results in almost no degradation in quality.

arxiv情報

著者 Mo Tiwari
発行日 2023-09-25 15:25:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.1.2 パーマリンク