Can We Identify Unknown Audio Recording Environments in Forensic Scenarios?

要約

録音された音声は、犯罪捜査において重要な証拠となる場合がある。その一つが、録音された音声と録音場所との法医学的関連付けである。例えば、音声メッセージは、犯罪の候補地を絞り込むための唯一の捜査手がかりとなる場合がある。これまで、比較的クリーンな録音条件下で、閉じた録音環境を分類するツールを提供する研究がいくつかある。しかし、法医学的捜査では、候補となる場所は事件ごとに異なる。そのため、各事件とそれぞれの候補セットに対して、十分な量の学習サンプルで再学習を行わなければ、クローズドセットのツールは適用できない。さらに、法医学ツールは、特性や品質が変化する、管理されていない音源からの音声素材を扱わなければならない。 そこで本研究では、実用的な法医学応用シナリオに向けた大きな一歩を踏み出す。EnvId(環境識別の略)と呼ばれる表現学習フレームワークを提案する。EnvIdはケースに応じた再学習を回避する。その代わりに、未知の環境位置のロバストな数ショット分類のための最初のツールである。我々は、EnvIdが法医学的に困難な素材を扱えることを実証する。EnvIdは、未知の信号劣化、環境特性、録画位置の不一致の下でも、高品質の予測を提供する。 我々のコードとデータセットは、承認され次第、一般公開される予定である。

要約(オリジナル)

Audio recordings may provide important evidence in criminal investigations. One such case is the forensic association of the recorded audio to the recording location. For example, a voice message may be the only investigative cue to narrow down the candidate sites for a crime. Up to now, several works provide tools for closed-set recording environment classification under relatively clean recording conditions. However, in forensic investigations, the candidate locations are case-specific. Thus, closed-set tools are not applicable without retraining on a sufficient amount of training samples for each case and respective candidate set. In addition, a forensic tool has to deal with audio material from uncontrolled sources with variable properties and quality. In this work, we therefore attempt a major step towards practical forensic application scenarios. We propose a representation learning framework called EnvId, short for environment identification. EnvId avoids case-specific retraining. Instead, it is the first tool for robust few-shot classification of unseen environment locations. We demonstrate that EnvId can handle forensically challenging material. It provides good quality predictions even under unseen signal degradations, environment characteristics or recording position mismatches. Our code and datasets will be made publicly available upon acceptance.

arxiv情報

著者 Denise Moussa,Germans Hirsch,Christian Riess
発行日 2024-05-03 14:19:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.SD, eess.AS パーマリンク