SLAM-based Joint Calibration of Multiple Asynchronous Microphone Arrays and Sound Source Localization

要約

複数のマイクロフォン アレイを備えたロボット オーディション システムには、実際に多くの用途があります。
しかし、複数のマイクロフォン アレイの正確なキャリブレーションは依然として困難です。これは、マイクロフォン アレイ間の相対変換 (つまり、向き、平行移動) や非同期要素 (つまり、初期時間オフセットやサンプリング クロックの差) など、特定すべき未知のパラメータが多数あるためです。
これらの課題に取り組むために、この論文では、複数の非同期マイク アレ​​イと音源定位の共同校正にバッチ同時定位およびマッピング (SLAM) を採用します。
フィッシャー情報行列 (FIM) アプローチを使用して、最初に上記の校正問題の可観測性分析 (つまり、パラメーターの識別可能性) を実行し、FIM とヤコビ行列が完全な列ランクを持つための必要/十分条件を確立します。これは、次のことを意味します。
未知のパラメータの識別可能性。
また、未知のパラメーターを一意に識別できないいくつかのシナリオも発見しました。
続いて、未知のパラメータを初期化するための効果的なフレームワークを提案します。これは、最適化の精度と収束をさらに向上させることを目的として、複数のマイクアレイキャリブレーションのバッチ SLAM の初期推定として使用されます。
提案された方法の性能を検証するために、広範な数値シミュレーションと実際の実験が実施されました。
実験結果は、提案されたパイプラインが、最適化や他の既存のフレームワークの初期推定として未知のパラメーターのノイズで破損したグラウンドトゥルースを使用する方法と比較して、高速収束でより高い精度を達成することを示しています。

要約(オリジナル)

Robot audition systems with multiple microphone arrays have many applications in practice. However, accurate calibration of multiple microphone arrays remains challenging because there are many unknown parameters to be identified, including the relative transforms (i.e., orientation, translation) and asynchronous factors (i.e., initial time offset and sampling clock difference) between microphone arrays. To tackle these challenges, in this paper, we adopt batch simultaneous localization and mapping (SLAM) for joint calibration of multiple asynchronous microphone arrays and sound source localization. Using the Fisher information matrix (FIM) approach, we first conduct the observability analysis (i.e., parameter identifiability) of the above-mentioned calibration problem and establish necessary/sufficient conditions under which the FIM and the Jacobian matrix have full column rank, which implies the identifiability of the unknown parameters. We also discover several scenarios where the unknown parameters are not uniquely identifiable. Subsequently, we propose an effective framework to initialize the unknown parameters, which is used as the initial guess in batch SLAM for multiple microphone arrays calibration, aiming to further enhance optimization accuracy and convergence. Extensive numerical simulations and real experiments have been conducted to verify the performance of the proposed method. The experiment results show that the proposed pipeline achieves higher accuracy with fast convergence in comparison to methods that use the noise-corrupted ground truth of the unknown parameters as the initial guess in the optimization and other existing frameworks.

arxiv情報

著者 Jiang Wang,Yuanzheng He,Daobilige Su,Katsutoshi Itoyama,Kazuhiro Nakadai,Junfeng Wu,Shoudong Huang,Youfu Li,He Kong
発行日 2024-05-30 08:21:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク