要約
脇見運転者のアクティビティ認識は、リスク回避において重要な役割を果たしており、特にインテリジェント交通システムでは有益です。
しかし、既存の方法のほとんどは単一ビューからのビデオのみを利用しており、難易度の不一致の問題は無視されています。
それらとは異なり、この研究では、さまざまなカメラビューからのデータを共同モデル化し、難易度に基づいて例を明示的に再重み付けすることにより、3D の注意力散漫ドライバーの活動認識のための新しいマルチカメラ機能統合 (MIFI) アプローチを提案します。
私たちの貢献は 2 つあります。 (1) シンプルだが効果的なマルチカメラ機能統合フレームワークを提案し、3 種類の機能融合技術を提供します。
(2)注意力散漫運転者の活動認識における難易度不一致の問題に対処するために、簡単なサンプルと難しいサンプルを一緒に学習できる例の再重み付けと呼ばれる定期的な学習方法を提案します。
3MDAD データセットの実験結果は、提案された MIFI がシングルビュー モデルと比較して一貫してパフォーマンスを向上できることを示しています。
要約(オリジナル)
Distracted driver activity recognition plays a critical role in risk aversion-particularly beneficial in intelligent transportation systems. However, most existing methods make use of only the video from a single view and the difficulty-inconsistent issue is neglected. Different from them, in this work, we propose a novel MultI-camera Feature Integration (MIFI) approach for 3D distracted driver activity recognition by jointly modeling the data from different camera views and explicitly re-weighting examples based on their degree of difficulty. Our contributions are two-fold: (1) We propose a simple but effective multi-camera feature integration framework and provide three types of feature fusion techniques. (2) To address the difficulty-inconsistent problem in distracted driver activity recognition, a periodic learning method, named example re-weighting that can jointly learn the easy and hard samples, is presented. The experimental results on the 3MDAD dataset demonstrate that the proposed MIFI can consistently boost performance compared to single-view models.
arxiv情報
著者 | Jian Kuang,Wenjing Li,Fang Li,Jun Zhang,Zhongcheng Wu |
発行日 | 2024-01-25 11:50:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google