Knowledge Combination to Learn Rotated Detection Without Rotated Annotation




– 回転で及びのある物体の出力の曖昧さを大幅に減らすために回転バウンディングボックスを使用することが優れています。
– しかし、回転検出器は回転アノテーションを行うことが労力がかかるため広く使用されていません。代わりに、軸に沿ったアノテーションが使用される検出データセットが多く提供されています。
– この論文では、モデルがターゲットデータセットの軸に沿ったアノテーションのみを必要として、正確な回転ボックスを予測できるフレームワークを提案しています。
– これを実現するために、ニューラルネットワークがタスクで利用するものよりも豊富な表現を学習できるという事実を利用しています。
– 未使用の表現はより詳細なタスクに対応するために利用できます。フレームワークは、ドメイン知識の弱いアノテーション付きターゲットデータセットと、アノテーションの強いドメイン外ソースデータセットのタスク知識を組み合わせます。
– 新しい割り当てプロセスとプロジェクション損失を使用して、ソースとターゲットデータセットで共同訓練を可能にします。
– 結果、モデルは推論中の追加の計算オーバーヘッドなしに、ターゲットドメインでより詳細なタスクを解決できます。提案された方法を、生鮮食品データセット、HRSC2016、SSDDを含むさまざまなターゲットデータセットで広範に評価しました。
– 結果は、提案された方法が完全に監視されたアプローチと同等の結果を一貫して提供することを示しています。


Rotated bounding boxes drastically reduce output ambiguity of elongated objects, making it superior to axis-aligned bounding boxes. Despite the effectiveness, rotated detectors are not widely employed. Annotating rotated bounding boxes is such a laborious process that they are not provided in many detection datasets where axis-aligned annotations are used instead. In this paper, we propose a framework that allows the model to predict precise rotated boxes only requiring cheaper axis-aligned annotation of the target dataset 1. To achieve this, we leverage the fact that neural networks are capable of learning richer representation of the target domain than what is utilized by the task. The under-utilized representation can be exploited to address a more detailed task. Our framework combines task knowledge of an out-of-domain source dataset with stronger annotation and domain knowledge of the target dataset with weaker annotation. A novel assignment process and projection loss are used to enable the co-training on the source and target datasets. As a result, the model is able to solve the more detailed task in the target domain, without additional computation overhead during inference. We extensively evaluate the method on various target datasets including fresh-produce dataset, HRSC2016 and SSDD. Results show that the proposed method consistently performs on par with the fully supervised approach.


著者 Tianyu Zhu,Bryce Ferenczi,Pulak Purkait,Tom Drummond,Hamid Rezatofighi,Anton van den Hengel
発行日 2023-04-05 03:07:36+00:00
arxivサイト arxiv_id(pdf)

