VPRTempo: A Fast Temporally Encoded Spiking Neural Network for Visual Place Recognition

要約

スパイキング・ニューラル・ネットワーク(SNN)は、その潜在的なエネルギー効率、低レイテンシー、継続的学習能力のおかげで、ニューロモーフィック・コンピューティングの最前線にいる。これらの能力はロボット工学のタスクに適しているが、SNNのこの分野への適応はこれまで限定的であった。本研究では、視覚的場所認識(Visual Place Recognition:VPR)のためのSNNを導入する。このSNNは、数分以内に学習可能であり、ミリ秒単位で問い合わせ可能であるため、計算能力に制約のあるロボットシステムへの導入に適している。我々の提案するシステムVPRTempoは、生物学的リアリズムを効率と引き換えにした抽象化SNNを用いて、遅い学習時間と推論時間を克服する。VPRTempoは、スパイクの数を決定するレートコードに依存する以前のSNNとは対照的に、ピクセルの強度に基づいて1つのスパイクのタイミングを決定する時間コードを採用しており、スパイク効率を100%以上改善する。VPRTempoは、スパイクタイミング依存可塑性(Spike-Timing Dependent Plasticity)と教師付きデルタ学習ルール(supervised delta learning rule)を用いて学習され、各出力スパイクニューロンは単一の場所にのみ反応する。このシステムを、最大27kの場所を含むNordlandとOxford RobotCarのローカライゼーションベンチマークデータセットで評価した。その結果、VPRTempoの精度は先行するSNNや一般的なNetVLADの場所認識アルゴリズムに匹敵することがわかった。また、VPRTempoは数桁高速であり、CPU上で50Hz以上の推論速度を持つリアルタイム展開に適している。VPRTempoは、宇宙ロボットや水中ロボットのようなリソースに制約のあるシステムのオンラインSLAMのループクロージャーコンポーネントとして統合される可能性がある。

要約(オリジナル)

Spiking Neural Networks (SNNs) are at the forefront of neuromorphic computing thanks to their potential energy-efficiency, low latencies, and capacity for continual learning. While these capabilities are well suited for robotics tasks, SNNs have seen limited adaptation in this field thus far. This work introduces a SNN for Visual Place Recognition (VPR) that is both trainable within minutes and queryable in milliseconds, making it well suited for deployment on compute-constrained robotic systems. Our proposed system, VPRTempo, overcomes slow training and inference times using an abstracted SNN that trades biological realism for efficiency. VPRTempo employs a temporal code that determines the timing of a single spike based on a pixel’s intensity, as opposed to prior SNNs relying on rate coding that determined the number of spikes; improving spike efficiency by over 100%. VPRTempo is trained using Spike-Timing Dependent Plasticity and a supervised delta learning rule enforcing that each output spiking neuron responds to just a single place. We evaluate our system on the Nordland and Oxford RobotCar benchmark localization datasets, which include up to 27k places. We found that VPRTempo’s accuracy is comparable to prior SNNs and the popular NetVLAD place recognition algorithm, while being several orders of magnitude faster and suitable for real-time deployment — with inference speeds over 50 Hz on CPU. VPRTempo could be integrated as a loop closure component for online SLAM on resource-constrained systems such as space and underwater robots.

arxiv情報

著者 Adam D. Hines,Peter G. Stratton,Michael Milford,Tobias Fischer
発行日 2024-03-01 03:42:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク