要約
政府職員と民間人の間の交流は、公共の福祉と民主主義社会の機能に必要な国家の正当性に影響を与えます。
州の職員の中で最も目立つ、連絡が多い警察官は、交通停止中に年間 2,000 万回以上一般の人々と交流します。
現在、こうしたやり取りは身体装着カメラ (BWC) によって定期的に記録されており、警察の責任を強化し、警察と国民の交流を改善する手段として賞賛されています。
しかし、これらの複雑で争点となっている警察と国民のやり取りの分析を可能にする信頼できる自動ツールが不足しているため、これらの録音をタイムリーに分析することが妨げられています。
この記事では、この BWC 映像からの音声、ビデオ、トランスクリプト情報を分析するための、新しいマルチパースペクティブ、マルチモーダル機械学習 (ML) ツールを開発するアプローチを提案します。
私たちのアプローチは、地域住民と警察官の両方を含むさまざまな関係者にとって最も顕著なコミュニケーションの側面を特定することから始まります。
私たちは、単一のグラウンド トゥルースの存在を中心に構築されたモデリング アプローチから離れ、代わりにソフト ラベリングの新たな進歩を利用して、異なる観察者が同じインタラクションをどのように認識するかの変化を組み込んでいます。
新しい ML ツールの概念化と設計に対するこの包括的なアプローチは、教育、医療、職場を含む人間の相互作用の領域にわたるコミュニケーションの研究と分析ツールの開発に広く適用できると私たちは主張します。
要約(オリジナル)
Interactions between the government officials and civilians affect public wellbeing and the state legitimacy that is necessary for the functioning of democratic society. Police officers, the most visible and contacted agents of the state, interact with the public more than 20 million times a year during traffic stops. Today, these interactions are regularly recorded by body-worn cameras (BWCs), which are lauded as a means to enhance police accountability and improve police-public interactions. However, the timely analysis of these recordings is hampered by a lack of reliable automated tools that can enable the analysis of these complex and contested police-public interactions. This article proposes an approach to developing new multi-perspective, multimodal machine learning (ML) tools to analyze the audio, video, and transcript information from this BWC footage. Our approach begins by identifying the aspects of communication most salient to different stakeholders, including both community members and police officers. We move away from modeling approaches built around the existence of a single ground truth and instead utilize new advances in soft labeling to incorporate variation in how different observers perceive the same interactions. We argue that this inclusive approach to the conceptualization and design of new ML tools is broadly applicable to the study of communication and development of analytic tools across domains of human interaction, including education, medicine, and the workplace.
arxiv情報
著者 | Benjamin A. T. Grahama,Lauren Brown,Georgios Chochlakis,Morteza Dehghani,Raquel Delerme,Brittany Friedman,Ellie Graeden,Preni Golazizian,Rajat Hebbar,Parsa Hejabi,Aditya Kommineni,Mayagüez Salinas,Michael Sierra-Arévalo,Jackson Trager,Nicholas Weller,Shrikanth Narayanan |
発行日 | 2024-02-09 05:25:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google