Learning Disentangled Representations in the Imaging Domain

要約

もつれた表現の学習は、監督がなくても、または限られた監督下でも、一般的な表現を学習するためのアプローチとして提案されています。
適切な一般表現は、適度な量のデータを使用して新しいターゲット タスク用に微調整したり、目に見えないドメインで直接使用したりして、対応するタスクで顕著なパフォーマンスを達成することができます。
このデータと注釈の要件の緩和は、コンピューター ビジョンとヘルスケアのアプリケーションに興味をそそる見通しを提供します。
このチュートリアル ペーパーでは、絡み合っていない表現の必要性を喚起し、重要な概念を再検討し、そのような表現を学習するための実用的な構成要素と基準について説明します。
模範的な重要な作品で行われた選択を強調して、医用画像のアプリケーションを調査し、コンピューター ビジョン アプリケーションへのリンクについて説明します。
最後に、制限、課題、および機会を示します。

要約(オリジナル)

Disentangled representation learning has been proposed as an approach to learning general representations even in the absence of, or with limited, supervision. A good general representation can be fine-tuned for new target tasks using modest amounts of data, or used directly in unseen domains achieving remarkable performance in the corresponding task. This alleviation of the data and annotation requirements offers tantalising prospects for applications in computer vision and healthcare. In this tutorial paper, we motivate the need for disentangled representations, revisit key concepts, and describe practical building blocks and criteria for learning such representations. We survey applications in medical imaging emphasising choices made in exemplar key works, and then discuss links to computer vision applications. We conclude by presenting limitations, challenges, and opportunities.

arxiv情報

著者 Xiao Liu,Pedro Sanchez,Spyridon Thermos,Alison Q. O’Neil,Sotirios A. Tsaftaris
発行日 2022-07-29 12:18:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク