Qualitative Analysis of $ω$-Regular Objectives on Robust MDPs

要約

堅牢なマルコフ決定プロセス(RMDP)は、一連の遷移関数のセットを定義することにより、遷移確率の不確実性を考慮する古典的なMDPを一般化します。
目的は、RMDPの一連の実行(または無限の軌跡)であり、目的の価値は、エージェントが敵対的環境に対して保証できる最大確率です。
(a)到達可能性の目標を考慮します。到達可能性の目的では、目標は状態のターゲットセットを与えられているため、最終的にはそのうちの1つに到達することです。
(b)$ \ omega $の正規目標の標準表現であるパリティ目標。
定性分析の問題は、確率1で目的を確保できるかどうかを尋ねます。この作業では、RMDPの構造、例えばユニチーンやアリオヨウ素酸塩の構造について仮定することなく、RMDPの到達可能性とパリティ目標の定性的問題を研究します。
私たちの貢献は2つあります。
最初に、到達可能性とパリティ目標の定性的な問題を解決する不確実性セットへのOracleアクセスを伴う効率的なアルゴリズムを提示します。
次に、数千の州までの文献からの古典的なRMDP例に対するOracleベースのアプローチの有効性を実証する実験結果を報告します。

要約(オリジナル)

Robust Markov Decision Processes (RMDPs) generalize classical MDPs that consider uncertainties in transition probabilities by defining a set of possible transition functions. An objective is a set of runs (or infinite trajectories) of the RMDP, and the value for an objective is the maximal probability that the agent can guarantee against the adversarial environment. We consider (a) reachability objectives, where given a target set of states, the goal is to eventually arrive at one of them; and (b) parity objectives, which are a canonical representation for $\omega$-regular objectives. The qualitative analysis problem asks whether the objective can be ensured with probability 1. In this work, we study the qualitative problem for reachability and parity objectives on RMDPs without making any assumption over the structures of the RMDPs, e.g., unichain or aperiodic. Our contributions are twofold. We first present efficient algorithms with oracle access to uncertainty sets that solve qualitative problems of reachability and parity objectives. We then report experimental results demonstrating the effectiveness of our oracle-based approach on classical RMDP examples from the literature scaling up to thousands of states.

arxiv情報

著者 Ali Asadi,Krishnendu Chatterjee,Ehsan Kafshdar Goharshady,Mehrdad Karrabi,Ali Shafiee
発行日 2025-05-07 16:15:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Qualitative Analysis of $ω$-Regular Objectives on Robust MDPs はコメントを受け付けていません

Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions

要約

凸スコアリング機能を特徴とする、広範なクラスのリスク目標の下で強化学習(RL)フレームワークを提案します。
このクラスは、分散、予想される不足、リスクのエントロピーバリュー、平均リスクのユーティリティなど、多くの一般的なリスク測定値をカバーしています。
時間継承の問題を解決するために、拡張状態空間と補助変数を検討し、2つの状態の最適化問題として問題を再astします。
カスタマイズされたアクターcriticアルゴリズムを提案し、いくつかの理論的近似保証を確立します。
重要な理論的貢献は、私たちの結果がマルコフの決定プロセスを継続的にする必要がないことです。
さらに、特定の条件下で収束する交互の最小化アルゴリズムに触発された補助変数サンプリング方法を提案します。
シミュレーション実験でのアプローチを検証し、統計的arbitrage取引における財務アプリケーションを使用して、アルゴリズムの有効性を実証します。

要約(オリジナル)

We propose a reinforcement learning (RL) framework under a broad class of risk objectives, characterized by convex scoring functions. This class covers many common risk measures, such as variance, Expected Shortfall, entropic Value-at-Risk, and mean-risk utility. To resolve the time-inconsistency issue, we consider an augmented state space and an auxiliary variable and recast the problem as a two-state optimization problem. We propose a customized Actor-Critic algorithm and establish some theoretical approximation guarantees. A key theoretical contribution is that our results do not require the Markov decision process to be continuous. Additionally, we propose an auxiliary variable sampling method inspired by the alternating minimization algorithm, which is convergent under certain conditions. We validate our approach in simulation experiments with a financial application in statistical arbitrage trading, demonstrating the effectiveness of the algorithm.

arxiv情報

著者 Shanyu Han,Yang Liu,Xiang Yu
発行日 2025-05-07 16:31:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, q-fin.MF, q-fin.RM | Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions はコメントを受け付けていません

Purity Law for Generalizable Neural TSP Solvers

要約

さまざまなスケールと分布にわたる神経アプローチの一般化を達成することは、巡回セールスマンの問題〜(TSP)にとって重要な課題です。
重要な障害は、ニューラルネットワークが普遍的なパターンを特定し、多様なインスタンスから最適なソリューションを導き出すための堅牢な原則を学習できないことが多いことです。
この論文では、最初に最適なTSPソリューションの基本的な構造原理である純度法(PULA)を明らかにし、エッジの有病率が周囲の頂点のスパースと指数関数的に成長することを定義します。
多様なインスタンス全体で統計的に検証されたプラは、グローバルオプティマの局所スパース性に対する一貫したバイアスを明らかにしています。
この洞察に基づいて、私たちは純度政策最適化〜(PUP)を提案します。これは、一般化を強化するためにソリューション構築プロセス中に、神経溶液の特性をプラと明示的に整列させる新しいトレーニングパラダイムです。
広範な実験は、PUPが人気のあるニューラルソルバーとシームレスに統合され、推論中に追加の計算オーバーヘッドが発生することなく、一般化パフォーマンスを大幅に向上させることができることを示しています。

要約(オリジナル)

Achieving generalization in neural approaches across different scales and distributions remains a significant challenge for the Traveling Salesman Problem~(TSP). A key obstacle is that neural networks often fail to learn robust principles for identifying universal patterns and deriving optimal solutions from diverse instances. In this paper, we first uncover Purity Law (PuLa), a fundamental structural principle for optimal TSP solutions, defining that edge prevalence grows exponentially with the sparsity of surrounding vertices. Statistically validated across diverse instances, PuLa reveals a consistent bias toward local sparsity in global optima. Building on this insight, we propose Purity Policy Optimization~(PUPO), a novel training paradigm that explicitly aligns characteristics of neural solutions with PuLa during the solution construction process to enhance generalization. Extensive experiments demonstrate that PUPO can be seamlessly integrated with popular neural solvers, significantly enhancing their generalization performance without incurring additional computational overhead during inference.

arxiv情報

著者 Wenzhao Liu,Haoran Li,Congying Han,Zicheng Zhang,Anqi Li,Tiande Guo
発行日 2025-05-07 16:46:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Purity Law for Generalizable Neural TSP Solvers はコメントを受け付けていません

Fight Fire with Fire: Defending Against Malicious RL Fine-Tuning via Reward Neutralization

要約

強化学習(RL)微調整は大規模な言語モデルを変換しながら、実験的に検証する脆弱性を生み出します。私たちの実験は、悪意のあるRLが驚くべき効率で安全ガードレールを解体することを示しており、50ステップと最小限の敵対的なプロンプトのみを必要とし、0-2から7-9に有害なエスカレートが必要です。
この攻撃ベクトルは、特にパラメーターレベルのアクセスでオープンソースモデルを脅かします。
監視された微調整を標的とする既存の防御は、RLの動的フィードバックメカニズムに対して効果がないことを証明します。
RLの微調整攻撃に対して特別に設計された最初の防衛フレームワークである報酬中立化を導入し、悪意のある報酬信号を効果的に表現する簡潔な拒否パターンを確立します。
私たちのアプローチは、攻撃者が悪用できない最小限の情報拒否を生成するようにモデルを訓練し、有害な出力に向けて最適化する試みを体系的に中和します。
実験では、私たちのアプローチが200の攻撃ステップの後に低い有害なスコア(2以下)を維持することを検証しますが、標準モデルは急速に劣化します。
この作業は、ますますアクセス可能なRL攻撃に対する堅牢な防御が達成可能であり、オープンウェイトモデルの重要なセキュリティギャップに対処できるという最初の建設的な証拠を提供します。

要約(オリジナル)

Reinforcement learning (RL) fine-tuning transforms large language models while creating a vulnerability we experimentally verify: Our experiment shows that malicious RL fine-tuning dismantles safety guardrails with remarkable efficiency, requiring only 50 steps and minimal adversarial prompts, with harmful escalating from 0-2 to 7-9. This attack vector particularly threatens open-source models with parameter-level access. Existing defenses targeting supervised fine-tuning prove ineffective against RL’s dynamic feedback mechanisms. We introduce Reward Neutralization, the first defense framework specifically designed against RL fine-tuning attacks, establishing concise rejection patterns that render malicious reward signals ineffective. Our approach trains models to produce minimal-information rejections that attackers cannot exploit, systematically neutralizing attempts to optimize toward harmful outputs. Experiments validate that our approach maintains low harmful scores (no greater than 2) after 200 attack steps, while standard models rapidly deteriorate. This work provides the first constructive proof that robust defense against increasingly accessible RL attacks is achievable, addressing a critical security gap for open-weight models.

arxiv情報

著者 Wenjun Cao
発行日 2025-05-07 17:18:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Fight Fire with Fire: Defending Against Malicious RL Fine-Tuning via Reward Neutralization はコメントを受け付けていません

AI Governance to Avoid Extinction: The Strategic Landscape and Actionable Research Questions

要約

人類は、あらゆる認知領域と活動の人間の専門家を大幅に上回るAIシステムをすぐに開発するためにコースにあるようです。
デフォルトの軌跡は、人間の絶滅を含む大惨事の可能性が高いと考えています。
リスクは、強力なAIシステムを制御できないこと、悪意のある不正行為者によるAIの誤用、大国間の戦争、権威主義的ロックインから生じます。
この研究アジェンダには、AI開発の戦略的景観を説明し、重要なガバナンス研究の質問をカタログ化するという2つの目的があります。
これらの質問は、回答した場合、壊滅的なリスクをうまく削減する方法に関する重要な洞察を提供します。
高度なAI開発に対する地政学的な反応のための4つの高レベルシナリオを説明し、それぞれに最も関連する研究の質問をカタログ化します。
私たちの好まれたシナリオでは、国際的に危険なAIの開発と展開(オフスイッチと呼ばれる)を制限するために必要な技術的、法的、および制度的インフラストラクチャを構築することが含まれます。
私たちが説明する2番目のシナリオは、米国政府が高度なAIシステムを開発し、グローバルなAI開発に対する一方的な制御を確立するために競争するAIの米国国家プロジェクトです。
また、2つの追加のシナリオについて説明します。今日のシナリオと同様のライトタッチの世界と、国が妨害と抑止力を使用してAI開発を遅らせる妨害状況の脅威です。
私たちの見解では、オフスイッチと停止シナリオとは別に、これらの軌跡はすべて、壊滅的な害の容認できないリスクを負っているようです。
米国の国家安全保障コミュニティとAIガバナンスエコシステムから緊急の行動が必要であり、主要な研究の質問に答え、危険なAI活動を停止する能力を構築し、国際的なAI協定に備えます。

要約(オリジナル)

Humanity appears to be on course to soon develop AI systems that substantially outperform human experts in all cognitive domains and activities. We believe the default trajectory has a high likelihood of catastrophe, including human extinction. Risks come from failure to control powerful AI systems, misuse of AI by malicious rogue actors, war between great powers, and authoritarian lock-in. This research agenda has two aims: to describe the strategic landscape of AI development and to catalog important governance research questions. These questions, if answered, would provide important insight on how to successfully reduce catastrophic risks. We describe four high-level scenarios for the geopolitical response to advanced AI development, cataloging the research questions most relevant to each. Our favored scenario involves building the technical, legal, and institutional infrastructure required to internationally restrict dangerous AI development and deployment (which we refer to as an Off Switch), which leads into an internationally coordinated Halt on frontier AI activities at some point in the future. The second scenario we describe is a US National Project for AI, in which the US Government races to develop advanced AI systems and establish unilateral control over global AI development. We also describe two additional scenarios: a Light-Touch world similar to that of today and a Threat of Sabotage situation where countries use sabotage and deterrence to slow AI development. In our view, apart from the Off Switch and Halt scenario, all of these trajectories appear to carry an unacceptable risk of catastrophic harm. Urgent action is needed from the US National Security community and AI governance ecosystem to answer key research questions, build the capability to halt dangerous AI activities, and prepare for international AI agreements.

arxiv情報

著者 Peter Barnett,Aaron Scher
発行日 2025-05-07 17:35:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY | AI Governance to Avoid Extinction: The Strategic Landscape and Actionable Research Questions はコメントを受け付けていません

WATCH: Weighted Adaptive Testing for Changepoint Hypotheses via Weighted-Conformal Martingales

要約

ハイステークス設定で人工知能(AI) /機械学習(ML)システムを責任を持って展開するには、間違いなくシステムの信頼性の証明だけでなく、安全でない動作を迅速に検出および対処するための継続的な展開後の監視が必要です。
ノンパラメトリック変化点検出のための統計的方法 – 特に、コンフォーマルテストマルチンゲール(CTMS)のツールといつでも検証された推論 – は、この監視タスクに対する有望なアプローチを提供します。
ただし、既存の方法は、限られた仮説クラスまたは「アラーム基準」、または特定の交換可能性の仮定に違反するデータシフトなど、シフトに応じてオンライン適応を許可しないような監視に限定されています。
このホワイトペーパーでは、偽のアラームを制御しながら、データ分布の予期しない変更点のオンライン監視の理論的基盤を築くための理論的基礎を築くための適合テストマーティンゲレス(WCTMS)の加重一般化を提案することにより、これらの監視方法の範囲を拡大します。
実用的なアプリケーションについては、概念シフト(条件付きラベル分布)や極端な(サポート外)などのより深刻なシフトに応答して、軽度の共変量シフト(限界入力分布)へのオンライン適応に対応する特定のWCTMアルゴリズムを提案します。
実際のデータセットでは、最先端のベースラインと比較してパフォーマンスの向上を示します。

要約(オリジナル)

Responsibly deploying artificial intelligence (AI) / machine learning (ML) systems in high-stakes settings arguably requires not only proof of system reliability, but moreover continual, post-deployment monitoring to quickly detect and address any unsafe behavior. Statistical methods for nonparametric change-point detection — especially the tools of conformal test martingales (CTMs) and anytime-valid inference — offer promising approaches to this monitoring task. However, existing methods are restricted to monitoring limited hypothesis classes or “alarm criteria,” such as data shifts that violate certain exchangeability assumptions, or do not allow for online adaptation in response to shifts. In this paper, we expand the scope of these monitoring methods by proposing a weighted generalization of conformal test martingales (WCTMs), which lay a theoretical foundation for online monitoring for any unexpected changepoints in the data distribution while controlling false-alarms. For practical applications, we propose specific WCTM algorithms that accommodate online adaptation to mild covariate shifts (in the marginal input distribution) while raising alarms in response to more severe shifts, such as concept shifts (in the conditional label distribution) or extreme (out-of-support) covariate shifts that cannot be easily adapted to. On real-world datasets, we demonstrate improved performance relative to state-of-the-art baselines.

arxiv情報

著者 Drew Prinster,Xing Han,Anqi Liu,Suchi Saria
発行日 2025-05-07 17:53:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML | WATCH: Weighted Adaptive Testing for Changepoint Hypotheses via Weighted-Conformal Martingales はコメントを受け付けていません

Score Distillation Sampling for Audio: Source Separation, Synthesis, and Beyond

要約

オーディオSDSを紹介します。オーディオSDは、テキストコンディショニングされたオーディオ拡散モデルにスコア蒸留サンプリング(SDS)の一般化です。
SDSは最初は画像拡散を使用してテキストから3Dの世代向けに設計されていましたが、強力な生成型を個別のパラメトリック表現に蒸留するという中心的なアイデアは、オーディオドメインに拡張されます。
単一の前提条件モデルを活用すると、Audio-SDSは、特殊なデータセットを必要とせずに幅広いタスクを可能にします。
特に、オーディオSDが物理的に情報に基づいたインパクトサウンドシミュレーションをガイドし、FM合成パラメーターを校正し、プロンプト指定のソース分離を実行する方法を示します。
私たちの調査結果は、モダリティ全体で蒸留ベースの方法の汎用性を示し、オーディオタスクで生成プライアーを使用して将来の作業のための堅牢な基盤を確立します。

要約(オリジナル)

We introduce Audio-SDS, a generalization of Score Distillation Sampling (SDS) to text-conditioned audio diffusion models. While SDS was initially designed for text-to-3D generation using image diffusion, its core idea of distilling a powerful generative prior into a separate parametric representation extends to the audio domain. Leveraging a single pretrained model, Audio-SDS enables a broad range of tasks without requiring specialized datasets. In particular, we demonstrate how Audio-SDS can guide physically informed impact sound simulations, calibrate FM-synthesis parameters, and perform prompt-specified source separation. Our findings illustrate the versatility of distillation-based methods across modalities and establish a robust foundation for future work using generative priors in audio tasks.

arxiv情報

著者 Jessie Richter-Powell,Antonio Torralba,Jonathan Lorraine
発行日 2025-05-07 17:59:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, cs.AI, cs.LG, cs.MM, cs.SD, eess.AS, H.5.1 | Score Distillation Sampling for Audio: Source Separation, Synthesis, and Beyond はコメントを受け付けていません

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

要約

Audio-Visuual Speech Speech Septureation(AVSR)は、リップベースのビデオとオーディオを組み合わせて、ノイズのパフォーマンスを向上させることができますが、ほとんどの方法は英語のデータでのみトレーニングされています。
1つの制限は、大規模な多言語ビデオデータがないことです。これにより、モデルをゼロからトレーニングすることが困難です。
この作業では、事前に訓練されたオーディオモデル(Whisper)とビデオモデル(AV-Hubert)の強度を組み合わせた多言語AVSRのMwhisper-Flamingoを提案します。
より良いマルチモーダル統合を有効にし、ノイズの多い多言語パフォーマンスを改善するために、ペアのオーディオ視聴覚入力と個別のオーディオ/ビジュアル入力の両方でモデルがトレーニングされるデコーダーモダリティドロップアウトを導入します。
Mwisper-Flamingoは、9言語のAVSRデータセットであるMuavicで最先端のWERを達成しています。
視聴覚MWHISPER-FLAMINGOは、騒々しい条件ですべての言語でオーディオのみのささやきを常に上回っています。

要約(オリジナル)

Audio-Visual Speech Recognition (AVSR) combines lip-based video with audio and can improve performance in noise, but most methods are trained only on English data. One limitation is the lack of large-scale multilingual video data, which makes it hard to train models from scratch. In this work, we propose mWhisper-Flamingo for multilingual AVSR which combines the strengths of a pre-trained audio model (Whisper) and video model (AV-HuBERT). To enable better multi-modal integration and improve the noisy multilingual performance, we introduce decoder modality dropout where the model is trained both on paired audio-visual inputs and separate audio/visual inputs. mWhisper-Flamingo achieves state-of-the-art WER on MuAViC, an AVSR dataset of 9 languages. Audio-visual mWhisper-Flamingo consistently outperforms audio-only Whisper on all languages in noisy conditions.

arxiv情報

著者 Andrew Rouditchenko,Samuel Thomas,Hilde Kuehne,Rogerio Feris,James Glass
発行日 2025-05-07 13:06:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.SD, eess.AS | mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition はコメントを受け付けていません

Geometry-Aware Texture Generation for 3D Head Modeling with Artist-driven Control

要約

正確な芸術的ビジョンに一致する仮想キャラクターのための現実的な3Dヘッド資産を作成することは、依然として労働集約的です。
生成された3Dヘッドを直感的に制御することにより、このプロセスを合理化する新しいフレームワークを提示します。
私たちのアプローチでは、異なる人口統計でヘッドジオメトリとスキンテクスチャマップの間の相関関係を学習する幾何学的なテクスチャ合成パイプラインを使用しています。
このフレームワークは、3つのレベルの芸術的コントロールを提供します。全体的なヘッドジオメトリの操作、顔の特徴を維持しながら肌の色調の調整、しわや顔の毛などの詳細の微細な編集です。
パイプラインを使用すると、アーティストは馴染みのあるツールを使用して単一のテクスチャマップに編集を行うことができ、システムは現実的なレンダリングに必要な残りのテクスチャマップ全体でこれらの変更を自動的に伝播します。
実験は、私たちの方法がきれいなジオメトリで多様な結果をもたらすことを示しています。
肌のトーン調整や、年齢に関連した詳細を追加したり、スキャンされたモデルから不要な機能を削除するための編集ワークフローを簡素化した編集ワークフローなど、アーティストの直感的なコントロールに焦点を当てた実用的なアプリケーションを紹介します。
この統合アプローチは、仮想文字作成の芸術的ワークフローを合理化することを目的としています。

要約(オリジナル)

Creating realistic 3D head assets for virtual characters that match a precise artistic vision remains labor-intensive. We present a novel framework that streamlines this process by providing artists with intuitive control over generated 3D heads. Our approach uses a geometry-aware texture synthesis pipeline that learns correlations between head geometry and skin texture maps across different demographics. The framework offers three levels of artistic control: manipulation of overall head geometry, adjustment of skin tone while preserving facial characteristics, and fine-grained editing of details such as wrinkles or facial hair. Our pipeline allows artists to make edits to a single texture map using familiar tools, with our system automatically propagating these changes coherently across the remaining texture maps needed for realistic rendering. Experiments demonstrate that our method produces diverse results with clean geometries. We showcase practical applications focusing on intuitive control for artists, including skin tone adjustments and simplified editing workflows for adding age-related details or removing unwanted features from scanned models. This integrated approach aims to streamline the artistic workflow in virtual character creation.

arxiv情報

著者 Amin Fadaeinejad,Abdallah Dib,Luiz Gustavo Hafemann,Emeline Got,Trevor Anderson,Amaury Depierre,Nikolaus F. Troje,Marcus A. Brubaker,Marc-André Carbonneau
発行日 2025-05-07 13:11:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.GR | Geometry-Aware Texture Generation for 3D Head Modeling with Artist-driven Control はコメントを受け付けていません

Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle

要約

前の車両の視覚的追跡により、路面の異常を検出するための新しいアプローチが提案されています。
この方法は多用途であり、これらのケースの視覚検出器のトレーニングに依存する直接観察方法とは異なり、pot穴、隆起、破片など、あらゆる種類の道路異常を予測します。
この方法は、視認性の低い条件または密なトラフィックで動作し、前の車両によって異常が閉塞されます。
異常は予測的に検出されます。つまり、車両がそれらに遭遇する前に、低レベルの車両システム(シャーシなど)を事前に構成するか、自律運転の場合に回避操作を計画することができます。
課題は、前の車両のカメラベースの追跡からの信号が弱く、エゴ車両に影響を与える振動のためにカメラエゴの動きによって妨害される可能性があることです。
したがって、反復的な堅牢な推定器によるカメラのピッチの回転を補償する効率的な方法を提案します。
制御されたセットアップと通常の交通条件の両方での実験は、エゴ車両が不完全な道路面を横断する困難な場合でも、遠くで道路の異常を確実に検出できることを示しています。
この方法は効果的であり、標準の消費者ハードウェアでリアルタイムで実行されます。

要約(オリジナル)

A novel approach to detect road surface anomalies by visual tracking of a preceding vehicle is proposed. The method is versatile, predicting any kind of road anomalies, such as potholes, bumps, debris, etc., unlike direct observation methods that rely on training visual detectors of those cases. The method operates in low visibility conditions or in dense traffic where the anomaly is occluded by a preceding vehicle. Anomalies are detected predictively, i.e., before a vehicle encounters them, which allows to pre-configure low-level vehicle systems (such as chassis) or to plan an avoidance maneuver in case of autonomous driving. A challenge is that the signal coming from camera-based tracking of a preceding vehicle may be weak and disturbed by camera ego motion due to vibrations affecting the ego vehicle. Therefore, we propose an efficient method to compensate camera pitch rotation by an iterative robust estimator. Our experiments on both controlled setup and normal traffic conditions show that road anomalies can be detected reliably at a distance even in challenging cases where the ego vehicle traverses imperfect road surfaces. The method is effective and performs in real time on standard consumer hardware.

arxiv情報

著者 Petr Jahoda,Jan Cech
発行日 2025-05-07 13:17:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle はコメントを受け付けていません