Learning Good Features to Transfer Across Tasks and Domains

要約

ラベル付きデータの可用性は、コンピューター ビジョン タスク用のディープ ラーニング アルゴリズムを新しいドメインに展開する上での大きな障害です。
さまざまなタスクを解決するために採用された多くのフレームワークが同じアーキテクチャを共有しているという事実は、特定の設定で学習した知識を再利用して、追加の監督を制限するかまったく行わずに新しいタスクを解決する方法があることを示唆しています。
この作業では、特定のドメイン内のタスク固有の深い機能間のマッピングを学習することにより、そのような知識をタスク間で共有できることを最初に示します。
次に、ニューラルネットワークによって実装されたこのマッピング関数が、未知の新しいドメインに一般化できることを示します。
さらに、学習した特徴空間を制約し、学習を容易にし、マッピングネットワークの一般化機能を向上させる一連の戦略を提案し、それによってフレームワークの最終的なパフォーマンスを大幅に改善します。
私たちの提案は、単眼深度推定とセマンティック セグメンテーション タスクの間で知識を伝達することにより、挑戦的な合成から現実への適応シナリオで説得力のある結果を取得します。

要約(オリジナル)

Availability of labelled data is the major obstacle to the deployment of deep learning algorithms for computer vision tasks in new domains. The fact that many frameworks adopted to solve different tasks share the same architecture suggests that there should be a way of reusing the knowledge learned in a specific setting to solve novel tasks with limited or no additional supervision. In this work, we first show that such knowledge can be shared across tasks by learning a mapping between task-specific deep features in a given domain. Then, we show that this mapping function, implemented by a neural network, is able to generalize to novel unseen domains. Besides, we propose a set of strategies to constrain the learned feature spaces, to ease learning and increase the generalization capability of the mapping network, thereby considerably improving the final performance of our framework. Our proposal obtains compelling results in challenging synthetic-to-real adaptation scenarios by transferring knowledge between monocular depth estimation and semantic segmentation tasks.

arxiv情報

著者 Pierluigi Zama Ramirez,Adriano Cardace,Luca De Luigi,Alessio Tonioni,Samuele Salti,Luigi Di Stefano
発行日 2023-01-26 18:49:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク