要約
ドメイン シフトは、特にボリューム 3D 画像内のオブジェクト検出において、深層学習アルゴリズムのパフォーマンスに大きな影響を与えます。
注釈付きトレーニング データは、深層学習ベースのオブジェクト検出に不可欠です。
ただし、密集したオブジェクトに注釈を付けるには時間とコストがかかります。
代わりに、個別にスキャンされたオブジェクトでモデルをトレーニングし、トレーニング データと検出データの間でドメイン シフトを引き起こすことをお勧めします。
この課題に対処するために、12 種類のバグの 9154 マイクロ CT ボリュームと、密集したバグ混合物の 388 ボリュームで構成される BugNIST データセットを導入します。
このデータセットは、ソース ドメインとターゲット ドメインに同じ外観を持つオブジェクトがあるという特徴があります。これは、ドメイン シフトの他のベンチマーク データセットでは珍しいことです。
トレーニング中は、クラスごとにラベル付けされた個々のバグ ボリュームが使用され、テストでは中心点の注釈とバグ タイプのラベルを組み合わせて使用されます。
データセットとともに、3D オブジェクト検出方法の分野の進歩を目的としたベースライン検出分析を提供します。
要約(オリジナル)
Domain shift significantly influences the performance of deep learning algorithms, particularly for object detection within volumetric 3D images. Annotated training data is essential for deep learning-based object detection. However, annotating densely packed objects is time-consuming and costly. Instead, we suggest training models on individually scanned objects, causing a domain shift between training and detection data. To address this challenge, we introduce the BugNIST dataset, comprising 9154 micro-CT volumes of 12 bug types and 388 volumes of tightly packed bug mixtures. This dataset is characterized by having objects with the same appearance in the source and target domain, which is uncommon for other benchmark datasets for domain shift. During training, individual bug volumes labeled by class are utilized, while testing employs mixtures with center point annotations and bug type labels. Together with the dataset, we provide a baseline detection analysis, aiming at advancing the field of 3D object detection methods.
arxiv情報
著者 | Patrick Møller Jensen,Vedrana Andersen Dahl,Carsten Gundlach,Rebecca Engberg,Hans Martin Kjer,Anders Bjorholm Dahl |
発行日 | 2024-03-19 16:40:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google