Let Me DeCode You: Decoder Conditioning with Tabular Data

要約

3D セグメンテーション タスク用のディープ ニューラル ネットワークのトレーニングは困難な場合があり、多くの場合、モデルのパフォーマンスを向上させるための効率的かつ効果的な戦略が必要です。
この研究では、トレーニング プロセスの効率を高めることを目的として、再構築プロセスでデコーダを動的にサポートするモデル コンディショニングにラベル由来の特徴を利用する新しいアプローチ DeCode を紹介します。
DeCode は、3D ラベルの形状特徴の学習された数値表現にコンディショニング埋め込みを組み込むことで、3D セグメンテーションのパフォーマンスを向上させることに重点を置いています。
具体的には、トレーニング段階で調整を適用してネットワークを堅牢なセグメンテーションに導くアプローチを開発します。
推論中にラベルが利用できない場合、トレーニング段階で学習したフィードフォワード ネットワークのおかげで、モデルは必要な条件付け埋め込みを入力データから直接推論します。
このアプローチは、歯の合成データとコーンビーム コンピューター断層撮影 (CBCT) 画像を使用してテストされます。
CBCT では、3 つのデータセットが使用されます。1 つは公開されており、2 つは社内にあります。
私たちの結果は、DeCode が目に見えないデータへの一般化の点で従来の無条件モデルを大幅に上回り、削減された計算コストでより高い精度を達成することを示しています。
この研究は、3D データ セグメンテーションにおけるコンディショニング戦略を探求するこの種の最初の研究であり、注釈付きデータを活用するための斬新でより効率的な方法を提供します。
私たちのコード、事前トレーニング済みモデルは https://github.com/SanoScience/DeCode で公開されています。

要約(オリジナル)

Training deep neural networks for 3D segmentation tasks can be challenging, often requiring efficient and effective strategies to improve model performance. In this study, we introduce a novel approach, DeCode, that utilizes label-derived features for model conditioning to support the decoder in the reconstruction process dynamically, aiming to enhance the efficiency of the training process. DeCode focuses on improving 3D segmentation performance through the incorporation of conditioning embedding with learned numerical representation of 3D-label shape features. Specifically, we develop an approach, where conditioning is applied during the training phase to guide the network toward robust segmentation. When labels are not available during inference, our model infers the necessary conditioning embedding directly from the input data, thanks to a feed-forward network learned during the training phase. This approach is tested using synthetic data and cone-beam computed tomography (CBCT) images of teeth. For CBCT, three datasets are used: one publicly available and two in-house. Our results show that DeCode significantly outperforms traditional, unconditioned models in terms of generalization to unseen data, achieving higher accuracy at a reduced computational cost. This work represents the first of its kind to explore conditioning strategies in 3D data segmentation, offering a novel and more efficient method for leveraging annotated data. Our code, pre-trained models are publicly available at https://github.com/SanoScience/DeCode .

arxiv情報

著者 Tomasz Szczepański,Michal K. Grzeszczyk,Szymon Płotka,Arleta Adamowicz,Piotr Fudalej,Przemysław Korzeniowski,Tomasz Trzciński,Arkadiusz Sitek
発行日 2024-07-12 17:14:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク