Deep hybrid models: infer and plan in a dynamic world

要約

複雑なタスクの最適な計画を決定するために、多くの場合、いくつかのエンティティ間の動的および階層的な関係を扱います。
従来、このような問題は、コスト関数の最適化に依存する最適な制御で取り組まれています。
代わりに、最近の生物学的に動機付けられた提案は、推論プロセスとして計画と管理をキャストしています。
アクティブな推論は、行動と知覚が人生の2つの補完的な側面であり、前者の役割は後者によって推測される予測を満たすことであると想定しています。
ここでは、3つの機能に基づいて、個別の連続処理を活用するアクティブな推論アプローチを提示します。目的のオブジェクトに関連する潜在的な身体構成の表現。
エージェントがツールの使用のために体スキーマを簡単に解釈し、柔軟に拡張できるようにする階層的な関係の使用。
エージェントの意図に関連する潜在的な軌跡の定義は、異なる時間スケールで動的要素を推測および計画するために使用されます。
この深いハイブリッドモデルを習慣的なタスクで評価します。移動するツールを選んだ後に移動するオブジェクトに到達します。
モデルが異なる条件下で提示されたタスクに取り組むことができることを示します。
この研究は、推論としての計画に関する過去の作業を拡張し、最適な制御への代替方向を進めます。

要約(オリジナル)

To determine an optimal plan for complex tasks, one often deals with dynamic and hierarchical relationships between several entities. Traditionally, such problems are tackled with optimal control, which relies on the optimization of cost functions; instead, a recent biologically-motivated proposal casts planning and control as an inference process. Active inference assumes that action and perception are two complementary aspects of life whereby the role of the former is to fulfill the predictions inferred by the latter. Here, we present an active inference approach that exploits discrete and continuous processing, based on three features: the representation of potential body configurations in relation to the objects of interest; the use of hierarchical relationships that enable the agent to easily interpret and flexibly expand its body schema for tool use; the definition of potential trajectories related to the agent’s intentions, used to infer and plan with dynamic elements at different temporal scales. We evaluate this deep hybrid model on a habitual task: reaching a moving object after having picked a moving tool. We show that the model can tackle the presented task under different conditions. This study extends past work on planning as inference and advances an alternative direction to optimal control.

arxiv情報

著者 Matteo Priorelli,Ivilin Peev Stoianov
発行日 2025-05-09 13:47:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Deep hybrid models: infer and plan in a dynamic world はコメントを受け付けていません

Safe-EF: Error Feedback for Nonsmooth Constrained Optimization

要約

フェデレーション学習は、モデルの更新の高次元により、深刻なコミュニケーションボトルネックに直面しています。
収縮コンプレッサー(例えば、TOP-K)との通信圧縮は、実際には好ましいことがよくありますが、適切な取り扱いなしでパフォーマンスを低下させる可能性があります。
エラーフィードバック(EF)はそのような問題を軽減しますが、スムーズで制約のない問題のために大部分が制限されており、非滑らかな目的と安全上の制約が重要な現実世界の適用性を制限しています。
収縮圧縮を備えた1次アルゴリズムの新しい低い複雑さの境界を確立することにより、標準的な非スムース凸環境でのEFの理解を促進します。
次に、実際のアプリケーションに不可欠な安全性の制約を実施しながら、下限(一定まで)に一致する新しいアルゴリズムであるSafe-EFを提案します。
確率的設定へのアプローチを拡張すると、理論と実用的な実装の間のギャップを埋めます。
分散型ヒューマノイドロボットトレーニングをシミュレートする強化学習セットアップにおける広範な実験は、安全性を確保し、コミュニケーションの複雑さを減らすためのSafe-EFの有効性を検証します。

要約(オリジナル)

Federated learning faces severe communication bottlenecks due to the high dimensionality of model updates. Communication compression with contractive compressors (e.g., Top-K) is often preferable in practice but can degrade performance without proper handling. Error feedback (EF) mitigates such issues but has been largely restricted for smooth, unconstrained problems, limiting its real-world applicability where non-smooth objectives and safety constraints are critical. We advance our understanding of EF in the canonical non-smooth convex setting by establishing new lower complexity bounds for first-order algorithms with contractive compression. Next, we propose Safe-EF, a novel algorithm that matches our lower bound (up to a constant) while enforcing safety constraints essential for practical applications. Extending our approach to the stochastic setting, we bridge the gap between theory and practical implementation. Extensive experiments in a reinforcement learning setup, simulating distributed humanoid robot training, validate the effectiveness of Safe-EF in ensuring safety and reducing communication complexity.

arxiv情報

著者 Rustem Islamov,Yarden As,Ilyas Fatkhullin
発行日 2025-05-09 13:49:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML | Safe-EF: Error Feedback for Nonsmooth Constrained Optimization はコメントを受け付けていません

Fault Diagnosis of 3D-Printed Scaled Wind Turbine Blades

要約

この研究では、3Dプリントされたスケーリングモデル、有限要素シミュレーション、実験的モーダル分析、および機械学習技術を使用した風力タービンブレードの障害検出のための統合された方法論を提示します。
NREL 5MWブレードのスケーリングされたモデルを3D印刷を使用して製造し、重要な場所で亀裂型の損傷を導入しました。
有限要素分析を採用して、これらの損傷が自然周波数に与える影響を予測し、結果は制御されたハンマー衝撃テストを介して検証されました。
振動データは、時間領域と周波数領域の両方の特徴を抽出するために処理され、統計分析(ANOVA)を使用して主要な識別変数が識別されました。
サポートベクターマシンやK-Nearest Neighborsを含む機械学習分類器は、94%を超える分類精度を達成しました。
結果は、振動モード3、4、および6がこの刃の構造異常に特に敏感であることを明らかにしました。
この統合されたアプローチは、数値シミュレーションを実験的検証と組み合わせることの実現可能性を確認し、風力エネルギーアプリケーションの構造的健康監視システムへの道を開きます。

要約(オリジナル)

This study presents an integrated methodology for fault detection in wind turbine blades using 3D-printed scaled models, finite element simulations, experimental modal analysis, and machine learning techniques. A scaled model of the NREL 5MW blade was fabricated using 3D printing, and crack-type damages were introduced at critical locations. Finite Element Analysis was employed to predict the impact of these damages on the natural frequencies, with the results validated through controlled hammer impact tests. Vibration data was processed to extract both time-domain and frequency-domain features, and key discriminative variables were identified using statistical analyses (ANOVA). Machine learning classifiers, including Support Vector Machine and K-Nearest Neighbors, achieved classification accuracies exceeding 94%. The results revealed that vibration modes 3, 4, and 6 are particularly sensitive to structural anomalies for this blade. This integrated approach confirms the feasibility of combining numerical simulations with experimental validations and paves the way for structural health monitoring systems in wind energy applications.

arxiv情報

著者 Luis Miguel Esquivel-Sancho,Maryam Ghandchi Tehrani,Mauricio Muñoz-Arias,Mahmoud Askari
発行日 2025-05-09 14:25:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Fault Diagnosis of 3D-Printed Scaled Wind Turbine Blades はコメントを受け付けていません

Higher-Order Graphon Neural Networks: Approximation and Cut Distance

要約

グラフ制限モデルは、高密度グラフの制限のグラフンのようなもので、最近、グラフニューラルネットワーク(GNNS)のサイズ移動性を研究するために使用されています。
ほとんどの文献は、GNN(MPNN)に合格するメッセージに焦点を当てていますが、この作業では、より強力な高次GNNに参加します。
まず、グラフンの$ k $ -WLテスト(B \ ‘Oker、2023)をグラフンシグナル空間に拡張し、重要なツールとして信号加重さた同種密度を導入します。
例示的な焦点として、インフアイアントグラフネットワーク(IGN)がグラフンに一般化し、境界線形演算子に対応するIGN基底のサブセットを介して定義された不変のグラフンネットワーク(IWNS)を提案します。
この制限された根拠があっても、注文$ k $のiwnsは少なくとも$ k $ -wlテストと同じくらい強力であることを示し、$ l^p $距離でグラフンシグナルのユニバーサル近似結果を確立します。
これにより、Cai&Wang(2022)の以前の作業が大幅に拡張され、IWNS(IGN-Smallのサブセット)が、限界の完全なIGN基底と同じ表現力を効果的に返済することを示しています。
彼らのアプローチとは対照的に、私たちのIWNSの青写真は、MPNNとの比較可能性を促進するなど、Graphon空間のジオメトリとより良く整合しています。
典型的な高次のGNNは不連続なW.R.T.
距離を削減する – 収束の欠如を引き起こし、$ k $ -WL-輸送可能性の定義に本質的に結び付けられている。

要約(オリジナル)

Graph limit models, like graphons for limits of dense graphs, have recently been used to study size transferability of graph neural networks (GNNs). While most literature focuses on message passing GNNs (MPNNs), in this work we attend to the more powerful higher-order GNNs. First, we extend the $k$-WL test for graphons (B\’oker, 2023) to the graphon-signal space and introduce signal-weighted homomorphism densities as a key tool. As an exemplary focus, we generalize Invariant Graph Networks (IGNs) to graphons, proposing Invariant Graphon Networks (IWNs) defined via a subset of the IGN basis corresponding to bounded linear operators. Even with this restricted basis, we show that IWNs of order $k$ are at least as powerful as the $k$-WL test, and we establish universal approximation results for graphon-signals in $L^p$ distances. This significantly extends the prior work of Cai & Wang (2022), showing that IWNs–a subset of their IGN-small–retain effectively the same expressivity as the full IGN basis in the limit. In contrast to their approach, our blueprint of IWNs also aligns better with the geometry of graphon space, for example facilitating comparability to MPNNs. We highlight that, while typical higher-order GNNs are discontinuous w.r.t. cut distance–which causes their lack of convergence and is inherently tied to the definition of $k$-WL–transferability remains achievable.

arxiv情報

著者 Daniel Herbst,Stefanie Jegelka
発行日 2025-05-09 14:30:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Higher-Order Graphon Neural Networks: Approximation and Cut Distance はコメントを受け付けていません

Deep Diffusion Maps

要約

機械学習の分野における根本的な問題の1つは、次元削減です。
次元削減方法により、いわゆるディメンションの呪いと戦い、高次元データを視覚化し、一般に大規模なデータセットの保存と処理の効率を向上させることができます。
最もよく知られている非線形寸法削減方法の1つは、拡散マップです。
ただし、その美徳にもかかわらず、カーネルマトリックスのスペクトル分解に基づく拡散マップと他の多くのマニホールド学習方法の両方に、初期セット以外のデータに適用できないこと、計算の複雑さ、大規模なデータセットの高いメモリコストなどの欠点があります。
この作業では、深い学習に頼ることにより、これらの問題を軽減することを提案します。
具体的には、拡散マップの新しい定式化は、特定の制約のない最小化問題の解決策として提供され、それに基づいて、スペクトル分解を実行する必要なく、トレーニングサンプルの内側と外側の両方で拡散マップの埋め込みを計算するニューラルネットワークをトレーニングするコスト関数です。
このアプローチの機能は、拡散マップおよびnystrom法のさまざまなデータセットで、実際と合成の両方のデータセットで比較されます。

要約(オリジナル)

One of the fundamental problems within the field of machine learning is dimensionality reduction. Dimensionality reduction methods make it possible to combat the so-called curse of dimensionality, visualize high-dimensional data and, in general, improve the efficiency of storing and processing large data sets. One of the best-known nonlinear dimensionality reduction methods is Diffusion Maps. However, despite their virtues, both Diffusion Maps and many other manifold learning methods based on the spectral decomposition of kernel matrices have drawbacks such as the inability to apply them to data outside the initial set, their computational complexity, and high memory costs for large data sets. In this work, we propose to alleviate these problems by resorting to deep learning. Specifically, a new formulation of Diffusion Maps embedding is offered as a solution to a certain unconstrained minimization problem and, based on it, a cost function to train a neural network which computes Diffusion Maps embedding — both inside and outside the training sample — without the need to perform any spectral decomposition. The capabilities of this approach are compared on different data sets, both real and synthetic, with those of Diffusion Maps and the Nystrom method.

arxiv情報

著者 Sergio García-Heredia,Ángela Fernández,Carlos M. Alaíz
発行日 2025-05-09 14:31:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Deep Diffusion Maps はコメントを受け付けていません

Predicting fermionic densities using a Projected Quantum Kernel method

要約

投影された量子カーネル法に基づいたサポートベクターレグレッサーを使用して、量子化学と量子物質に関心のある1Dフェルミオンシステムの密度構造を予測します。
カーネルは、相互作用するrydberg原子で実装可能な量子貯水池の観測可能性で構築されています。
フェルミオンシステムのトレーニングとテストデータは、密度汎関数理論アプローチを使用して生成されます。
いくつかのハミルトニアンパラメーターのメソッドのパフォーマンスをテストし、測定時間の関数としてエラーの一般的な共通の動作を見つけます。
十分に大きな測定時間で、この方法は古典的な線形カーネル法を上回り、放射状基底関数法と競合することができることがわかります。

要約(オリジナル)

We use a support vector regressor based on a projected quantum kernel method to predict the density structure of 1D fermionic systems of interest in quantum chemistry and quantum matter. The kernel is built on with the observables of a quantum reservoir implementable with interacting Rydberg atoms. Training and test data of the fermionic system are generated using a Density Functional Theory approach. We test the performance of the method for several Hamiltonian parameters, finding a general common behavior of the error as a function of measurement time. At sufficiently large measurement times, we find that the method outperforms the classical linear kernel method and can be competitive with the radial basis function method.

arxiv情報

著者 Francesco Perciavalle,Francesco Plastina,Michele Pisarra,Nicola Lo Gullo
発行日 2025-05-09 14:51:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.str-el, cs.LG, quant-ph | Predicting fermionic densities using a Projected Quantum Kernel method はコメントを受け付けていません

FIC-TSC: Learning Time Series Classification with Fisher Information Constraint

要約

時系列データの分析は、経済学、オンライン市場、人間のヘルスケアなど、幅広いアプリケーションにとって非常に重要です。
特に、時系列の分類は、株式市場のさまざまなフェーズをセグメント化し、顧客の行動を予測し、労働者の行動とエンゲージメントレベルを分類する上で不可欠な役割を果たします。
これらの側面は、実際のアプリケーションでの自動意思決定とシステムの最適化の進歩に大きく貢献しています。
ただし、時系列データはトレーニングセットとテストセットの間のドメインシフトに苦しむことが多く、分類パフォーマンスを劇的に劣化させるという大きなコンセンサスがあります。
時系列回帰タスクのドメインシフトの処理における(可逆的)インスタンスの正規化の成功にもかかわらず、分類におけるそのパフォーマンスは不十分です。
この論文では、フィッシャー情報を制約として活用する時系列分類のトレーニングフレームワークである\ textit {fic-tsc}を提案します。
理論的および経験的にこれが効率的かつ効果的なソリューションであり、モデルをより平らな最小値に導くための効率的かつ効果的なソリューションであり、分布シフトの一般化可能性を高めることを示しています。
30 UEA多変量および85 UCR単変量データセットでの方法を厳密に評価します。
私たちの経験的結果は、最近の14の最先端の方法にわたる提案された方法の優位性を示しています。

要約(オリジナル)

Analyzing time series data is crucial to a wide spectrum of applications, including economics, online marketplaces, and human healthcare. In particular, time series classification plays an indispensable role in segmenting different phases in stock markets, predicting customer behavior, and classifying worker actions and engagement levels. These aspects contribute significantly to the advancement of automated decision-making and system optimization in real-world applications. However, there is a large consensus that time series data often suffers from domain shifts between training and test sets, which dramatically degrades the classification performance. Despite the success of (reversible) instance normalization in handling the domain shifts for time series regression tasks, its performance in classification is unsatisfactory. In this paper, we propose \textit{FIC-TSC}, a training framework for time series classification that leverages Fisher information as the constraint. We theoretically and empirically show this is an efficient and effective solution to guide the model converge toward flatter minima, which enhances its generalizability to distribution shifts. We rigorously evaluate our method on 30 UEA multivariate and 85 UCR univariate datasets. Our empirical results demonstrate the superiority of the proposed method over 14 recent state-of-the-art methods.

arxiv情報

著者 Xiwen Chen,Wenhui Zhu,Peijie Qiu,Hao Wang,Huayu Li,Zihan Li,Yalin Wang,Aristeidis Sotiras,Abolfazl Razi
発行日 2025-05-09 15:13:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | FIC-TSC: Learning Time Series Classification with Fisher Information Constraint はコメントを受け付けていません

Bridging Lottery Ticket and Grokking: Understanding Grokking from Inner Structure of Networks

要約

Grokkingは、一般化の遅延化の興味深い現象であり、ニューラルネットワークは最初は完全な精度でトレーニングデータを記憶していますが、一般化が不十分であり、その後継続的なトレーニングで一般化ソリューションに移行します。
この遅れた一般化を説明するために、体重の規範やスパース性などの要因が提案されていますが、ネットワーク構造の影響は未定です。
この作業では、グローキング現象を宝くじのチケット仮説にリンクして、内部ネットワーク構造の影響を調査します。
一般化段階で得られた宝くじチケットを利用することで(Grokkedチケットと呼ばれる)、複数のモジュラー算術操作、多項式回帰、スパースパリティ、MNIST分類など、さまざまなタスク全体の遅延一般化が大幅に削減されることを実証します。
制御された実験を通じて、一般化の遅延の緩和は、体重の規範の減少やスパースの増加だけでなく、むしろ優れたサブネットワークの発見によるものであることを示します。
さらに、Grokkedチケットは、周期的な重量パターン、平均パス長の増加、クラスタリング係数の減少などの有益なグラフプロパティを示し、一般化の改善と一致する急速な構造変化を受けることがわかります。
さらに、Edge-Popupアルゴリズムのような剪定技術は、重みを変更せずにこれらの効果的な構造を識別することができ、それにより、ネットワークを一般化するものに記憶するネットワークを変換することができます。
これらの結果は、構造探査がグラッキングを理解する上で極めて重要な役割を果たしているという新しい洞察を強調しています。
実装コードは、このリンクhttps://github.com/gouki510/grokking-ticketsからアクセスできます。

要約(オリジナル)

Grokking is an intriguing phenomenon of delayed generalization, where neural networks initially memorize training data with perfect accuracy but exhibit poor generalization, subsequently transitioning to a generalizing solution with continued training. While factors such as weight norms and sparsity have been proposed to explain this delayed generalization, the influence of network structure remains underexplored. In this work, we link the grokking phenomenon to the lottery ticket hypothesis to investigate the impact of internal network structures. We demonstrate that utilizing lottery tickets obtained during the generalizing phase (termed grokked tickets) significantly reduces delayed generalization across various tasks, including multiple modular arithmetic operations, polynomial regression, sparse parity, and MNIST classification. Through controlled experiments, we show that the mitigation of delayed generalization is not due solely to reduced weight norms or increased sparsity, but rather to the discovery of good subnetworks. Furthermore, we find that grokked tickets exhibit periodic weight patterns, beneficial graph properties such as increased average path lengths and reduced clustering coefficients, and undergo rapid structural changes that coincide with improvements in generalization. Additionally, pruning techniques like the edge-popup algorithm can identify these effective structures without modifying the weights, thereby transforming memorizing networks into generalizing ones. These results underscore the novel insight that structural exploration plays a pivotal role in understanding grokking. The implementation code can be accessed via this link: https://github.com/gouki510/Grokking-Tickets.

arxiv情報

著者 Gouki Minegishi,Yusuke Iwasawa,Yutaka Matsuo
発行日 2025-05-09 15:21:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Bridging Lottery Ticket and Grokking: Understanding Grokking from Inner Structure of Networks はコメントを受け付けていません

Learning-based adaption of robotic friction models

要約

人工知能と機械の自動化が中心的な役割を占める第4産業革命では、ロボットの展開は不可欠です。
ただし、特に人間との協力において、ロボットを使用した製造プロセスは非常に複雑です。
特に、ロボットジョイントの摩擦トルクのモデリングは、良い数学的説明がないため、長年の問題です。
これは、最近の作品でデータ駆動型の方法の使用を動機付けます。
ただし、モデルベースおよびデータ駆動型モデルは、このペーパーで示すように、訓練された特定のダイナミクスを超えて一般化する能力に制限を示すことがよくあります。
この課題に対処するために、既存の摩擦モデルを可能な限り少ないデータを使用して新しいダイナミクスに適応させることを目的とする残留学習に基づいた新しいアプローチを紹介します。
対称摩擦データセットでベースニューラルネットワークをトレーニングすることにより、速度と摩擦トルクの正確な関係を学習することにより、アプローチを検証します。
その後、より複雑な非対称設定に適応するために、初期ネットワークの出力の残差の予測に焦点を当てて、小さなデータセットで2番目のネットワークをトレーニングします。
両方のネットワークの出力を適切な方法で組み合わせることにより、提案された推定器は、従来のモデルベースのアプローチ、拡張ルーグルモデル、および基本ニューラルネットワークを大幅に上回ります。
さらに、外部負荷を含む軌跡に関する方法を評価し、従来のアプローチよりも約60〜70%の大幅な改善を観察します。
私たちの方法は、トレーニング中に外部負荷を伴うデータに依存しておらず、外部トルクセンサーの必要性を排除します。
これは、さまざまな設定での摩擦に関する事前知識に基づいて、多様なシナリオへの適応を有効にするために、1分ではなく、少量のデータがある場合でも、アプローチの一般化能力を示しています。

要約(オリジナル)

In the Fourth Industrial Revolution, wherein artificial intelligence and the automation of machines occupy a central role, the deployment of robots is indispensable. However, the manufacturing process using robots, especially in collaboration with humans, is highly intricate. In particular, modeling the friction torque in robotic joints is a longstanding problem due to the lack of a good mathematical description. This motivates the usage of data-driven methods in recent works. However, model-based and data-driven models often exhibit limitations in their ability to generalize beyond the specific dynamics they were trained on, as we demonstrate in this paper. To address this challenge, we introduce a novel approach based on residual learning, which aims to adapt an existing friction model to new dynamics using as little data as possible. We validate our approach by training a base neural network on a symmetric friction data set to learn an accurate relation between the velocity and the friction torque. Subsequently, to adapt to more complex asymmetric settings, we train a second network on a small dataset, focusing on predicting the residual of the initial network’s output. By combining the output of both networks in a suitable manner, our proposed estimator outperforms the conventional model-based approach, an extended LuGre model, and the base neural network significantly. Furthermore, we evaluate our method on trajectories involving external loads and still observe a substantial improvement, approximately 60-70%, over the conventional approach. Our method does not rely on data with external load during training, eliminating the need for external torque sensors. This demonstrates the generalization capability of our approach, even with a small amount of data–less than a minute–enabling adaptation to diverse scenarios based on prior knowledge about friction in different settings.

arxiv情報

著者 Philipp Scholl,Maged Iskandar,Sebastian Wolf,Jinoh Lee,Aras Bacho,Alexander Dietrich,Alin Albu-Schäffer,Gitta Kutyniok
発行日 2025-05-09 15:36:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Learning-based adaption of robotic friction models はコメントを受け付けていません

Realistic Adversarial Attacks for Robustness Evaluation of Trajectory Prediction Models via Future State Perturbation

要約

軌道予測は、自律型車両システムの重要な要素であり、他の道路利用者の動きを予測して対応できるようにします。
敵対的な攻撃に対する予測モデルの堅牢性を評価することは、実際のトラフィックにおける信頼性を確保するために不可欠です。
ただし、現在のアプローチは、周囲のエージェントの過去の位置を摂動することに焦点を当てる傾向があり、非現実的なシナリオを生成し、重要な脆弱性を見落とす可能性があります。
この制限は、現実世界の条件でのモデルパフォーマンスの過度に楽観的な評価をもたらす可能性があります。
この作業では、過去だけでなく将来の敵対的なエージェントの将来の状態が、以前に検出されなかった弱点を明らかにし、それによってモデルの堅牢性のより厳格な評価を提供できることを実証します。
私たちの斬新なアプローチには、動的な制約が組み込まれ、戦術的な行動を保持し、より効果的で現実的な敵対的な攻撃を可能にします。
これらの敵対的な軌跡のリアリズムと影響を評価するための新しいパフォーマンス測定を導入します。
最先端の予測モデルでの方法をテストすると、敵対条件下での予測エラーと衝突率の大幅な増加が明らかになりました。
定性分析はさらに、私たちの攻撃が、安全な予測と思われるものの潜在的な衝突を検出することができないなど、重大な弱点を暴露する可能性があることを示しました。
これらの結果は、自動運転車の軌跡予測モデルの信頼性をよりよく評価し、改善するために、より包括的な敵対的テストの必要性を強調しています。

要約(オリジナル)

Trajectory prediction is a key element of autonomous vehicle systems, enabling them to anticipate and react to the movements of other road users. Evaluating the robustness of prediction models against adversarial attacks is essential to ensure their reliability in real-world traffic. However, current approaches tend to focus on perturbing the past positions of surrounding agents, which can generate unrealistic scenarios and overlook critical vulnerabilities. This limitation may result in overly optimistic assessments of model performance in real-world conditions. In this work, we demonstrate that perturbing not just past but also future states of adversarial agents can uncover previously undetected weaknesses and thereby provide a more rigorous evaluation of model robustness. Our novel approach incorporates dynamic constraints and preserves tactical behaviors, enabling more effective and realistic adversarial attacks. We introduce new performance measures to assess the realism and impact of these adversarial trajectories. Testing our method on a state-of-the-art prediction model revealed significant increases in prediction errors and collision rates under adversarial conditions. Qualitative analysis further showed that our attacks can expose critical weaknesses, such as the inability of the model to detect potential collisions in what appear to be safe predictions. These results underscore the need for more comprehensive adversarial testing to better evaluate and improve the reliability of trajectory prediction models for autonomous vehicles.

arxiv情報

著者 Julian F. Schumann,Jeroen Hagenus,Frederik Baymler Mathiesen,Arkady Zgonnikov
発行日 2025-05-09 15:40:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG | Realistic Adversarial Attacks for Robustness Evaluation of Trajectory Prediction Models via Future State Perturbation はコメントを受け付けていません