AugmenTory: A Fast and Flexible Polygon Augmentation Library

要約

データ拡張は、画像処理のトレーニング手順の主要なコンポーネントとなっている限られたデータセットの課題に対処するための重要な技術です。
幾何学的変換や色空間調整などの技術は、トレーニング データセットを人為的に拡張し、トレーニング目的で半現実的なデータを生成する能力について徹底的にテストされています。
データ拡張は、画像処理トレーニング手順の主要な要素となっている限られたデータセットの課題に対処するための最も重要な鍵です。
幾何学的変換や色空間調整などのデータ拡張技術は、トレーニング データセットを人為的に拡張し、トレーニング目的で半現実的なデータを生成する能力について徹底的にテストされています。
ポリゴンはインスタンスのセグメンテーションにおいて重要な役割を果たしており、YOLOv8 などの高度なモデル全体で使用が急増しています。
人気が高まっているにもかかわらず、特殊なライブラリが不足しているため、ポリゴン拡張プロセスが妨げられています。
この文書では、新しく開発された AugmenTory ライブラリで具体化された、この課題に対する新しいソリューションを紹介します。
特に、AugmenTory は、既存の方法と比較して、時間と空間の両方で計算需要が削減されます。
さらに、ライブラリには後処理のしきい値処理機能が含まれています。
AugmenTory パッケージは GitHub で公開されており、興味のあるユーザーはソース コードにアクセスできます: https://github.com/Smartory/AugmenTory

要約(オリジナル)

Data augmentation is a key technique for addressing the challenge of limited datasets, which have become a major component in the training procedures of image processing. Techniques such as geometric transformations and color space adjustments have been thoroughly tested for their ability to artificially expand training datasets and generate semi-realistic data for training purposes. Data augmentation is the most important key to addressing the challenge of limited datasets, which have become a major component of image processing training procedures. Data augmentation techniques, such as geometric transformations and color space adjustments, are thoroughly tested for their ability to artificially expand training datasets and generate semi-realistic data for training purposes. Polygons play a crucial role in instance segmentation and have seen a surge in use across advanced models, such as YOLOv8. Despite their growing popularity, the lack of specialized libraries hampers the polygon-augmentation process. This paper introduces a novel solution to this challenge, embodied in the newly developed AugmenTory library. Notably, AugmenTory offers reduced computational demands in both time and space compared to existing methods. Additionally, the library includes a postprocessing thresholding feature. The AugmenTory package is publicly available on GitHub, where interested users can access the source code: https://github.com/Smartory/AugmenTory

arxiv情報

著者 Tanaz Ghahremani,Mohammad Hoseyni,Mohammad Javad Ahmadi,Pouria Mehrabi,Amirhossein Nikoofard
発行日 2024-05-07 16:07:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク