Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations

要約

犬の筋骨格系の検査は、獣医の現場において困難な課題です。
この研究では、視覚的表現を通じて犬の状態を効率的に記録できる新しい方法が開発されました。
ただし、ビジュアル ドキュメントは新しいため、既存のトレーニング データはありません。
したがって、この研究の目的は、AI ベースの診断サポート システムを開発するためにデータ不足の影響を軽減することです。
この目的を達成するために、AI モデルを事前トレーニングするために、病気の現実的な視覚的記録を模倣する合成データの可能性が調査されています。
現実的な視覚的文書を模倣する合成画像データを生成する方法を提案します。
最初に、3 つの異なるクラスを含む基本データセットが生成され、続いて 36 の異なるクラスを含むより洗練されたデータセットが作成されます。
どちらのデータセットも AI モデルの事前トレーニングに使用されます。
続いて、5 つの異なる疾患について手動で作成された 250 個の視覚的文書から構成される評価データセットが作成されます。
このデータセットと、25 個の例を含むサブセット。
25 例を含む評価データセットで得られた結果は、現実世界の視覚的文書を模倣する生成された合成画像を利用すると、診断精度が約 10% 大幅に向上することを示しています。
ただし、これらの結果は、250 例を含む大規模な評価データセットには当てはまりません。これは、AI モデルの事前トレーニングに合成データを使用する利点が主に現れるのは、特定の疾患に関する視覚的文書化の少数の例を扱う場合であることを示しています。
全体として、この研究は、生成された合成データの戦略的使用を通じて、限られたトレーニング データによって課される制限を軽減するための貴重な洞察を提供し、犬の筋骨格評価領域を超えて適用できるアプローチを提示します。

要約(オリジナル)

The examination of the musculoskeletal system in dogs is a challenging task in veterinary practice. In this work, a novel method has been developed that enables efficient documentation of a dog’s condition through a visual representation. However, since the visual documentation is new, there is no existing training data. The objective of this work is therefore to mitigate the impact of data scarcity in order to develop an AI-based diagnostic support system. To this end, the potential of synthetic data that mimics realistic visual documentations of diseases for pre-training AI models is investigated. We propose a method for generating synthetic image data that mimics realistic visual documentations. Initially, a basic dataset containing three distinct classes is generated, followed by the creation of a more sophisticated dataset containing 36 different classes. Both datasets are used for the pre-training of an AI model. Subsequently, an evaluation dataset is created, consisting of 250 manually created visual documentations for five different diseases. This dataset, along with a subset containing 25 examples. The obtained results on the evaluation dataset containing 25 examples demonstrate a significant enhancement of approximately 10% in diagnosis accuracy when utilizing generated synthetic images that mimic real-world visual documentations. However, these results do not hold true for the larger evaluation dataset containing 250 examples, indicating that the advantages of using synthetic data for pre-training an AI model emerge primarily when dealing with few examples of visual documentations for a given disease. Overall, this work provides valuable insights into mitigating the limitations imposed by limited training data through the strategic use of generated synthetic data, presenting an approach applicable beyond the canine musculoskeletal assessment domain.

arxiv情報

著者 Martin Thißen,Thi Ngoc Diep Tran,Ben Joel Schönbein,Ute Trapp,Barbara Esteve Ratsch,Beate Egner,Romana Piat,Elke Hergenröther
発行日 2024-09-12 16:13:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク