Potential failures of physics-informed machine learning in traffic flow modeling: theoretical and experimental analysis

要約

この研究では、トラフィックフローモデリングのための物理学に基づいた機械学習(PIML)アプローチのパフォーマンスを批判的に調べ、PIMLモデルの障害を純粋にデータ駆動型と純粋に物理ベースの両方のカウンターパートの両方を下回るシナリオとして定義します。
ヘシアンマトリックスの主要な固有ベクトルに沿って訓練されたモデルを摂動し、対応する損失値を評価することにより、損失の状況を分析します。
我々の結果は、PIMLの物理的残差が、一般的に想定される失敗の原因に反して、本質的に最適化を妨げないことを示唆しています。
代わりに、パラメーターの更新を成功させるには、準単純な勾配で急性角度を形成し、円錐領域内に横たわるためにMLと物理学の両方の勾配が必要です。
物理学モデルとトレーニングデータの両方の不正確さを考えると、この状態を満たすことはしばしば困難です。
実験により、物理残差は、特に高度に物理学駆動型の設定の下で、LWRおよびARZベースのPIMLモデルの性能を低下させることができます。
さらに、まばらなサンプリングと一時的に平均化されたトラフィックデータの使用は、実際の物理的ダイナミクスをキャプチャできず、モデルの故障に貢献する誤解を招くほど小さな物理学残差を生成する可能性があります。
また、Courant-Friedrichs-Lewy(CFL)条件を、PIMLのデータセット適合性の重要な指標として特定します。
最後に、ARZのような高次モデルは、既存の研究の実験的所見と一致するLWRのような低次モデルよりも大きなエラー低下を持つ傾向があることを観察します。

要約(オリジナル)

This study critically examines the performance of physics-informed machine learning (PIML) approaches for traffic flow modeling, defining the failure of a PIML model as the scenario where it underperforms both its purely data-driven and purely physics-based counterparts. We analyze the loss landscape by perturbing trained models along the principal eigenvectors of the Hessian matrix and evaluating corresponding loss values. Our results suggest that physics residuals in PIML do not inherently hinder optimization, contrary to a commonly assumed failure cause. Instead, successful parameter updates require both ML and physics gradients to form acute angles with the quasi-true gradient and lie within a conical region. Given inaccuracies in both the physics models and the training data, satisfying this condition is often difficult. Experiments reveal that physical residuals can degrade the performance of LWR- and ARZ-based PIML models, especially under highly physics-driven settings. Moreover, sparse sampling and the use of temporally averaged traffic data can produce misleadingly small physics residuals that fail to capture actual physical dynamics, contributing to model failure. We also identify the Courant-Friedrichs-Lewy (CFL) condition as a key indicator of dataset suitability for PIML, where successful applications consistently adhere to this criterion. Lastly, we observe that higher-order models like ARZ tend to have larger error lower bounds than lower-order models like LWR, which is consistent with the experimental findings of existing studies.

arxiv情報

著者 Yuan-Zheng Lei,Yaobang Gong,Dianwei Chen,Yao Cheng,Xianfeng Terry Yang
発行日 2025-05-16 17:55:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.comp-ph パーマリンク