Unsupervised Adaptation from Repeated Traversals for Autonomous Driving

要約

自動運転車が確実に動作するためには、その知覚システムをエンドユーザーの環境に合わせて一般化する必要があります。理想的には、追加の注釈作業は必要ありません。
考えられる解決策の 1 つは、エンドユーザーの環境 (つまり、ターゲット ドメイン) から収集されたラベルのないデータ (ラベルのない LiDAR 点群など) を活用して、システムをトレーニング環境とテスト環境の違いに適応させることです。
このような教師なしのドメイン適応問題について広範な研究が行われてきましたが、根本的な問題が 1 つ残っています。ターゲット ドメインには、適応プロセスを監視するための信頼できるシグナルがありません。
この問題を克服するために、繰り返されるルートの複数のトラバーサルから教師なしデータを簡単に収集できることがわかりました。
従来の教師なしドメイン適応とは異なりますが、多くのドライバーが同じ道路を共有しているため、この仮定は非常に現実的です。
この単純な追加の仮定は、ターゲット ドメインで 3D オブジェクト検出器の反復自己トレーニングを実行できる強力な信号を取得するのに十分であることを示します。
具体的には、ドメイン外検出器を使用して疑似ラベルを生成しますが、トラバーサル間で永続的であると思われるモバイル オブジェクトの検出を削除することで、誤検知を減らします。
さらに、永続的ではない領域での予測を奨励することで、偽陰性を減らします。
2 つの大規模な運転データセットでアプローチを実験し、車、歩行者、サイクリストの 3D オブジェクト検出が大幅に改善されたことを示し、一般化可能な自動運転に一歩近づきました。

要約(オリジナル)

For a self-driving car to operate reliably, its perceptual system must generalize to the end-user’s environment — ideally without additional annotation efforts. One potential solution is to leverage unlabeled data (e.g., unlabeled LiDAR point clouds) collected from the end-users’ environments (i.e. target domain) to adapt the system to the difference between training and testing environments. While extensive research has been done on such an unsupervised domain adaptation problem, one fundamental problem lingers: there is no reliable signal in the target domain to supervise the adaptation process. To overcome this issue we observe that it is easy to collect unsupervised data from multiple traversals of repeated routes. While different from conventional unsupervised domain adaptation, this assumption is extremely realistic since many drivers share the same roads. We show that this simple additional assumption is sufficient to obtain a potent signal that allows us to perform iterative self-training of 3D object detectors on the target domain. Concretely, we generate pseudo-labels with the out-of-domain detector but reduce false positives by removing detections of supposedly mobile objects that are persistent across traversals. Further, we reduce false negatives by encouraging predictions in regions that are not persistent. We experiment with our approach on two large-scale driving datasets and show remarkable improvement in 3D object detection of cars, pedestrians, and cyclists, bringing us a step closer to generalizable autonomous driving.

arxiv情報

著者 Yurong You,Cheng Perng Phoo,Katie Z Luo,Travis Zhang,Wei-Lun Chao,Bharath Hariharan,Mark Campbell,Kilian Q. Weinberger
発行日 2023-03-27 15:07:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク