要約
このペーパーでは、非線形音響コンピューティングと強化学習を統合した新しいフレームワークを紹介し、複雑なノイズと反響の下で高度なヒトとロボットの相互作用を強化します。
物理的に情報に基づいた波動方程式(例:Westervelt、KZK)を活用すると、このアプローチは、高調波生成や衝撃形成などの高次現象を捉えています。
これらのモデルを補強学習駆動型制御ループに埋め込むことにより、システムは、マルチパス干渉と非定常ノイズを緩和するために、重要なパラメーター(吸収、ビームフォーミングなど)を適応的に最適化します。
遠距離場の局在化、弱い信号検出、多言語の音声認識を覆う実験的評価は、このハイブリッド戦略が従来の線形方法と純粋にデータ駆動型のベースラインを超え、実世界のシナリオを要求する上で優れた騒音抑制、最小限の潜在性、堅牢な精度を達成することを実現します。
提案されたシステムは、AIハードウェア、ロボット、マシンオーディション、人工オーディション、および脳マシンインターフェイスの幅広いアプリケーションの見通しを示しています。
要約(オリジナル)
This paper introduces a novel framework integrating nonlinear acoustic computing and reinforcement learning to enhance advanced human-robot interaction under complex noise and reverberation. Leveraging physically informed wave equations (e.g., Westervelt, KZK), the approach captures higher-order phenomena such as harmonic generation and shock formation. By embedding these models in a reinforcement learning-driven control loop, the system adaptively optimizes key parameters (e.g., absorption, beamforming) to mitigate multipath interference and non-stationary noise. Experimental evaluations-covering far-field localization, weak signal detection, and multilingual speech recognition-demonstrate that this hybrid strategy surpasses traditional linear methods and purely data-driven baselines, achieving superior noise suppression, minimal latency, and robust accuracy in demanding real-world scenarios. The proposed system demonstrates broad application prospects in AI hardware, robot, machine audition, artificial audition, and brain-machine interfaces.
arxiv情報
著者 | Xiaoliang Chen,Xin Yu,Le Chang,Yunhe Huang,Jiashuai He,Shibo Zhang,Jin Li,Likai Lin,Ziyu Zeng,Xianling Tu,Shuyu Zhang |
発行日 | 2025-05-04 06:03:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google