Multi-dataset synergistic in supervised learning to pre-label structural components in point clouds from shell construction scenes

要約

新しいトレーニングデータセットにデータに注釈を付けるために必要な重要な努力は、建設業界でのコンピュータービジョンの研究と機械学習を妨げます。
この作業では、シェル構造サイトのコンテキストでのポイントクラウドセマンティックセグメンテーションのための標準データセットと最新のトランスモデルアーキテクチャの適応を探ります。
建物のインテリアと家具のオブジェクトセグメンテーションに焦点を当てた一般的なアプローチとは異なり、この研究は、建築、エンジニアリング、および建設(AEC)の複雑な構造成分をセグメント化するという課題に対処しました。
監視されたトレーニングとカスタム検証データセットを通じてベースラインを確立し、大規模な屋内データセットとのクロスドメイン推論を評価し、転送学習を利用して最小限の新しいデータでセグメンテーションパフォーマンスを最大化します。
調査結果は、最小限の微調整により、事前に訓練された変圧器アーキテクチャがコンポーネントセグメンテーションを構築するための効果的な戦略を提供することを示しています。
私たちの結果は、より大きなトレーニングリソースを作成する際に、以前に見えなかった新しいデータの注釈を自動化することと、頻繁に繰り返されるオブジェクトのセグメンテーションで有望です。

要約(オリジナル)

The significant effort required to annotate data for new training datasets hinders computer vision research and machine learning in the construction industry. This work explores adapting standard datasets and the latest transformer model architectures for point cloud semantic segmentation in the context of shell construction sites. Unlike common approaches focused on object segmentation of building interiors and furniture, this study addressed the challenges of segmenting complex structural components in Architecture, Engineering, and Construction (AEC). We establish a baseline through supervised training and a custom validation dataset, evaluate the cross-domain inference with large-scale indoor datasets, and utilize transfer learning to maximize segmentation performance with minimal new data. The findings indicate that with minimal fine-tuning, pre-trained transformer architectures offer an effective strategy for building component segmentation. Our results are promising for automating the annotation of new, previously unseen data when creating larger training resources and for the segmentation of frequently recurring objects.

arxiv情報

著者 Lukas Rauch,Thomas Braml
発行日 2025-02-20 16:48:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク