MelNet: A Real-Time Deep Learning Algorithm for Object Detection

要約

この研究では、MelNet という名前の物体検出のための新しい深層学習アルゴリズムが導入されました。
MelNet は、物体検出のために KITTI データセットを利用してトレーニングを受けました。
300 回のトレーニング エポックの後、MelNet は mAP (平均精度) スコア 0.732 を達成しました。
さらに、3 つの代替モデル (YOLOv5、EfficientDet、および Faster-RCNN-MobileNetv3) が KITTI データセットでトレーニングされ、物体検出のために MelNet と並列されました。
この結果は、特定の場合に転移学習を採用することの有効性を強調しています。
特に、著名なデータセット (ImageNet、COCO、Pascal VOC など) でトレーニングされた既存のモデルは優れた結果をもたらします。
別の発見は、特定のシナリオに合わせて調整された新しいモデルを作成し、それを特定のデータセットでトレーニングすることの実行可能性を強調しています。
この調査は、KITTI データセットのみでの MelNet のトレーニングも 150 エポック後に EfficientDet を超えることを示しています。
その結果、トレーニング後の MelNet のパフォーマンスは、事前トレーニングされた他のモデルのパフォーマンスとほぼ一致します。

要約(オリジナル)

In this study, a novel deep learning algorithm for object detection, named MelNet, was introduced. MelNet underwent training utilizing the KITTI dataset for object detection. Following 300 training epochs, MelNet attained an mAP (mean average precision) score of 0.732. Additionally, three alternative models -YOLOv5, EfficientDet, and Faster-RCNN-MobileNetv3- were trained on the KITTI dataset and juxtaposed with MelNet for object detection. The outcomes underscore the efficacy of employing transfer learning in certain instances. Notably, preexisting models trained on prominent datasets (e.g., ImageNet, COCO, and Pascal VOC) yield superior results. Another finding underscores the viability of creating a new model tailored to a specific scenario and training it on a specific dataset. This investigation demonstrates that training MelNet exclusively on the KITTI dataset also surpasses EfficientDet after 150 epochs. Consequently, post-training, MelNet’s performance closely aligns with that of other pre-trained models.

arxiv情報

著者 Yashar Azadvatan,Murat Kurt
発行日 2024-01-31 16:27:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク