Towards Infusing Auxiliary Knowledge for Distracted Driver Detection

要約

わき見運転は世界的に交通事故の主な原因となっています。
注意散漫運転の特定には、交通安全を強化するために、車載カメラのフィードからドライバーのさまざまな形態の注意散漫 (メール送信、食事、車載デバイスの使用など) を確実に検出および分類することが含まれます。
このタスクは、大規模な注釈付きデータセットを必要とせずに、さまざまなドライバーの行動セットに一般化できる堅牢なモデルが必要であるため、困難です。
この論文では、シーン内のエンティティ間の意味的関係とドライバーのポーズの構造的構成に関する補助知識を注入することにより、脇見運転者検出 (DDD) のための新しい方法である KiD3 を提案します。
具体的には、シーン グラフとドライバーの姿勢情報をビデオ フレーム内の視覚的な手がかりと統合して、ドライバーのアクションの全体的な表現を作成する統一フレームワークを構築します。私たちの結果は、KiD3 が視覚のみの場合と比較して 13.64% の精度向上を達成することを示しています。
このような補助的な知識と視覚的な情報を組み込むことでベースラインを構築します。

要約(オリジナル)

Distracted driving is a leading cause of road accidents globally. Identification of distracted driving involves reliably detecting and classifying various forms of driver distraction (e.g., texting, eating, or using in-car devices) from in-vehicle camera feeds to enhance road safety. This task is challenging due to the need for robust models that can generalize to a diverse set of driver behaviors without requiring extensive annotated datasets. In this paper, we propose KiD3, a novel method for distracted driver detection (DDD) by infusing auxiliary knowledge about semantic relations between entities in a scene and the structural configuration of the driver’s pose. Specifically, we construct a unified framework that integrates the scene graphs, and driver pose information with the visual cues in video frames to create a holistic representation of the driver’s actions.Our results indicate that KiD3 achieves a 13.64% accuracy improvement over the vision-only baseline by incorporating such auxiliary knowledge with visual information.

arxiv情報

著者 Ishwar B Balappanawar,Ashmit Chamoli,Ruwan Wickramarachchi,Aditya Mishra,Ponnurangam Kumaraguru,Amit P. Sheth
発行日 2024-08-29 15:28:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.0 パーマリンク