要約
医療分野では、大規模なデータセットの利用が限られていることと、労働集約的なアノテーション プロセスがディープ モデルのパフォーマンスの妨げとなっています。
拡散ベースの生成拡張アプローチは、下流の医療認識タスクの進歩に効果的であることが証明されており、この問題に対する有望な解決策を提示します。
それにもかかわらず、既存の作品には、困難なビデオ/3D シーケンス生成のための十分なセマンティックおよびシーケンシャル ステアビリティが欠けており、ノイズの多い合成サンプルの品質管理が無視されているため、合成データベースの信頼性が低くなり、下流タスクのパフォーマンスが大幅に制限されます。
この研究では、医学的配列分類を支援するために、高度にセマンティックおよびシーケンシャルにカスタマイズされた配列合成を可能にし、誤って合成されたサンプルを抑制する、新規で一般的な生成拡張フレームワークである Ctrl-GenAug を紹介します。
具体的には、まず、診断促進サンプルを制御可能に合成するためのマルチモーダルな条件ガイド型シーケンス ジェネレーターを設計します。
生成されたサンプルの時間的/立体的なコヒーレンスを強化するために、シーケンシャル拡張モジュールが統合されています。
次に、信頼性の低いケースを意味論的および逐次レベルで抑制するためのノイズの多い合成データ フィルターを提案します。
3 つのパラダイムで訓練された 11 のネットワークを使用した 3 つの医療データセットに関する広範な実験により、特に過小評価されている高リスク集団や領域外の状態における Ctrl-GenAug の有効性と一般性が包括的に分析されます。
要約(オリジナル)
In the medical field, the limited availability of large-scale datasets and labor-intensive annotation processes hinder the performance of deep models. Diffusion-based generative augmentation approaches present a promising solution to this issue, having been proven effective in advancing downstream medical recognition tasks. Nevertheless, existing works lack sufficient semantic and sequential steerability for challenging video/3D sequence generation, and neglect quality control of noisy synthesized samples, resulting in unreliable synthetic databases and severely limiting the performance of downstream tasks. In this work, we present Ctrl-GenAug, a novel and general generative augmentation framework that enables highly semantic- and sequential-customized sequence synthesis and suppresses incorrectly synthesized samples, to aid medical sequence classification. Specifically, we first design a multimodal conditions-guided sequence generator for controllably synthesizing diagnosis-promotive samples. A sequential augmentation module is integrated to enhance the temporal/stereoscopic coherence of generated samples. Then, we propose a noisy synthetic data filter to suppress unreliable cases at semantic and sequential levels. Extensive experiments on 3 medical datasets, using 11 networks trained on 3 paradigms, comprehensively analyze the effectiveness and generality of Ctrl-GenAug, particularly in underrepresented high-risk populations and out-domain conditions.
arxiv情報
著者 | Xinrui Zhou,Yuhao Huang,Haoran Dou,Shijing Chen,Ao Chang,Jia Liu,Weiran Long,Jian Zheng,Erjiao Xu,Jie Ren,Ruobing Huang,Jun Cheng,Wufeng Xue,Dong Ni |
発行日 | 2024-09-25 16:58:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google