要約
イベントベースのカメラは人間の目をシミュレートするセンサーであり、高速堅牢性や低消費電力などの利点を備えています。
確立された深層学習技術は、イベント データの処理において有効であることが証明されています。
Chimera は、イベント ベースのオブジェクト検出用に特別に設計されたブロック ベースのニューラル アーキテクチャ検索 (NAS) フレームワークで、RGB ドメイン処理メソッドをイベント ドメインに適応させる体系的なアプローチを作成することを目的としています。
Chimera 設計空間は、アテンション ブロック、畳み込み、状態空間モデル、MLP ミキサー ベースのアーキテクチャなどのさまざまなマクロブロックから構築されており、ローカル処理機能とグローバル処理機能の間の貴重なトレードオフ、およびさまざまなレベルの複雑さを提供します。
PErson Detection in Robotics (PEDRo) データセットの結果では、平均パラメーターが 1.6 倍削減されるとともに、主要な最先端モデルに匹敵するパフォーマンス レベルが実証されました。
要約(オリジナル)
Event-based cameras are sensors that simulate the human eye, offering advantages such as high-speed robustness and low power consumption. Established Deep Learning techniques have shown effectiveness in processing event data. Chimera is a Block-Based Neural Architecture Search (NAS) framework specifically designed for Event-Based Object Detection, aiming to create a systematic approach for adapting RGB-domain processing methods to the event domain. The Chimera design space is constructed from various macroblocks, including Attention blocks, Convolutions, State Space Models, and MLP-mixer-based architectures, which provide a valuable trade-off between local and global processing capabilities, as well as varying levels of complexity. The results on the PErson Detection in Robotics (PEDRo) dataset demonstrated performance levels comparable to leading state-of-the-art models, alongside an average parameter reduction of 1.6 times.
arxiv情報
著者 | Diego A. Silva,Ahmed Elsheikh,Kamilya Smagulova,Mohammed E. Fouda,Ahmed M. Eltawil |
発行日 | 2024-12-27 13:50:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google