Pedestrian Intention Classifier using ID3 Modelled Decision Trees for IoT Edge Devices

要約

自動運転車が関係する交通事故は、一般に、走行中の車両の進路に (歩行者) 障害物が非常に突然の間隔で現れる状況で発生し、ロボットが場面の変化に反応する時間がさらに短くなります。
この問題に取り組むために、MediaPipe 姿勢推定モデルから生成された四元数を使用して、2 次元フレーム内で任意に選択された 1 人の歩行者の意図を手続き型の論理状態に分類する新しいアルゴリズムの実装を提案します。
これにより、主に奥行き知覚の必要性の欠如と、ほとんどの IoT エッジ デバイスに存在する計算リソースの暗黙的な制限により、比較的待ち時間の長い深層学習アルゴリズムを使用する必要がなくなりました。
このモデルは、平均レイテンシー 48 ミリ秒で動作しながら、信頼性の高い分散 0.0042 で平均テスト精度 83.56% を達成することができ、これらの知覚タスクに時空間畳み込みネットワークを使用する現在の標準を超える複数の注目すべき利点を実証しました。

要約(オリジナル)

Road accidents involving autonomous vehicles commonly occur in situations where a (pedestrian) obstacle presents itself in the path of the moving vehicle at very sudden time intervals, leaving the robot even lesser time to react to the change in scene. In order to tackle this issue, we propose a novel algorithmic implementation that classifies the intent of a single arbitrarily chosen pedestrian in a two dimensional frame into logic states in a procedural manner using quaternions generated from a MediaPipe pose estimation model. This bypasses the need to employ any relatively high latency deep-learning algorithms primarily due to the lack of necessity for depth perception as well as an implicit cap on the computational resources that most IoT edge devices present. The model was able to achieve an average testing accuracy of 83.56% with a reliable variance of 0.0042 while operating with an average latency of 48 milliseconds, demonstrating multiple notable advantages over the current standard of using spatio-temporal convolutional networks for these perceptive tasks.

arxiv情報

著者 Sriram Radhakrishna,Adithya Balasubramanyam
発行日 2023-05-30 20:56:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク