Patch and Shuffle: A Preprocessing Technique for Texture Classification in Autonomous Cementitious Fabrication

要約

自律的な製造システムは、建設と製造を変革していますが、印刷エラーに対して脆弱なままです。
テクスチャ分類は、セメント質の製造中にリアルタイムの監視と調整を可能にするコンピュータービジョンシステムの重要なコンポーネントです。
従来の分類方法は、多くの場合、グローバルな画像機能に依存しているため、低レベルのテクスチャではなく、モデルをセマンティックコンテンツにバイアスすることができます。
この論文では、「パッチとシャッフル」と呼ばれる新しい前処理技術を紹介します。これは、画像を小さなパッチに入力し、シャッフルし、分類前にごちゃごちゃした画像を再構築します。
この変換によりセマンティックコンテキストが削除され、分類器がローカルテクスチャ機能に依存するように強制します。
ResNet-18ベースのアーキテクチャを使用して、押し出されたセメント画像のデータセットでこのアプローチを評価します。
私たちの実験は、パッチとシャッフル法を標準のパイプラインと比較し、他のすべての要因を一定に保ちます。
結果は、精度の大幅な改善を示しています。パッチとシャッフルモデルは、ベースラインの72.46%に対して90.64%のテスト精度を達成しました。
これらの調査結果は、グローバル構造を破壊すると、テクスチャベースの分類タスクのパフォーマンスが向上することを示唆しています。
この方法は、低レベルの特徴が高レベルのセマンティクスよりも重要な広範なビジョンタスクに影響を与えます。
この手法は、製造監視から医療イメージングまで、アプリケーションの分類を改善する可能性があります。

要約(オリジナル)

Autonomous fabrication systems are transforming construction and manufacturing, yet they remain vulnerable to print errors. Texture classification is a key component of computer vision systems that enable real-time monitoring and adjustment during cementitious fabrication. Traditional classification methods often rely on global image features, which can bias the model toward semantic content rather than low-level textures. In this paper, we introduce a novel preprocessing technique called ‘patch and shuffle,’ which segments input images into smaller patches, shuffles them, and reconstructs a jumbled image before classification. This transformation removes semantic context, forcing the classifier to rely on local texture features. We evaluate this approach on a dataset of extruded cement images, using a ResNet-18-based architecture. Our experiments compare the patch and shuffle method to a standard pipeline, holding all other factors constant. Results show a significant improvement in accuracy: the patch and shuffle model achieved 90.64% test accuracy versus 72.46% for the baseline. These findings suggest that disrupting global structure enhances performance in texture-based classification tasks. This method has implications for broader vision tasks where low-level features matter more than high-level semantics. The technique may improve classification in applications ranging from fabrication monitoring to medical imaging.

arxiv情報

著者 Jeremiah Giordani
発行日 2025-04-14 16:03:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク