Data Fusion of Semantic and Depth Information in the Context of Object Detection

要約

現代における自律走行に関しては、すでにかなりの研究が行われている。自律走行システムは、安全性を確保するために、自車周辺の物体を検出する能力に非常に優れていなければならない。本論文では、(自車両の3次元座標系に関する)物体(歩行者)の位置の分類と推定を研究し、自律走行の文脈における自車両と物体との距離を測定する。物体を分類するために、inception v2を用いた高速な領域ベース畳み込みニューラルネットワーク(R-CNN)が利用される。まず、オブジェクトの基準位置と車両からの距離を推定するために、カスタマイズされたデータセットを用いてネットワークを学習する。カメラの較正から距離の計算まで、一連のプロセスでコンピュータビジョンアルゴリズムの最先端技術が適用され、関心領域の3D基準点が生成される。このプロセスの最重要ステップは、ステレオビジョンの概念を用いて視差マップを生成することである。

要約(オリジナル)

Considerable study has already been conducted regarding autonomous driving in modern era. An autonomous driving system must be extremely good at detecting objects surrounding the car to ensure safety. In this paper, classification, and estimation of an object’s (pedestrian) position (concerning an ego 3D coordinate system) are studied and the distance between the ego vehicle and the object in the context of autonomous driving is measured. To classify the object, faster Region-based Convolution Neural Network (R-CNN) with inception v2 is utilized. First, a network is trained with customized dataset to estimate the reference position of objects as well as the distance from the vehicle. From camera calibration to computing the distance, cutting-edge technologies of computer vision algorithms in a series of processes are applied to generate a 3D reference point of the region of interest. The foremost step in this process is generating a disparity map using the concept of stereo vision.

arxiv情報

著者 Md Abu Yusuf,Md Rezaul Karim Khan,Partha Pratim Saha,Mohammed Mahbubur Rahaman
発行日 2024-12-04 17:26:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク