要約
ディープニューラルネットワークは、膨大な量の学習データを活用することで、様々な問題設定において最先端の結果を得ることができます。しかし、データの収集、保存、そして(教師あり学習の場合)ラベル付けは、高価で時間がかかる。また、ネットワークの汎化能力を評価したり、入力の変換によって推論された出力がどのように変化するかを予測することは、ネットワークがブラックボックスとして扱われることが多いため、複雑です。これらの問題は、ニューラルネットワークに事前知識を取り入れることで軽減することができます。コンピュータビジョンのタスクにおける畳み込みニューラルネットワークの成功にヒントを得て、予測可能な方法で出力に影響を与える、解決すべき問題の対称的な幾何学的変換に関する知識を組み込むことが、有望なアプローチの一つである。これにより、データ効率の向上と、より解釈しやすいネットワーク出力が期待できます。本サーベイでは、ニューラルネットワークに幾何学的な事前知識を組み込む様々なアプローチについて、簡潔な概要を示すことを試みる。さらに、これらの手法を自律走行における3次元物体検出に適用することで、有望な結果が得られると期待している。
要約(オリジナル)
Deep Neural Networks achieve state-of-the-art results in many different problem settings by exploiting vast amounts of training data. However, collecting, storing and – in the case of supervised learning – labelling the data is expensive and time-consuming. Additionally, assessing the networks’ generalization abilities or predicting how the inferred output changes under input transformations is complicated since the networks are usually treated as a black box. Both of these problems can be mitigated by incorporating prior knowledge into the neural network. One promising approach, inspired by the success of convolutional neural networks in computer vision tasks, is to incorporate knowledge about symmetric geometrical transformations of the problem to solve that affect the output in a predictable way. This promises an increased data efficiency and more interpretable network outputs. In this survey, we try to give a concise overview about different approaches that incorporate geometrical prior knowledge into neural networks. Additionally, we connect those methods to 3D object detection for autonomous driving, where we expect promising results when applying those methods.
arxiv情報
著者 | Matthias Rath,Alexandru Paul Condurache |
発行日 | 2023-03-03 15:36:34+00:00 |
arxivサイト | arxiv_id(pdf) |