High-speed control and navigation for quadrupedal robots on complex and discrete terrain

要約

離散的で幾何学的に複雑な環境における高速脚式ナビゲーションは、高自由度のダイナミクスと、最適化問題の長周期・非凸の性質のために、困難な課題である。本研究では、このような環境を高速に横断できる脚式ロボットのための階層的ナビゲーションパイプラインを提案する。提案するパイプラインは、プランナーモジュールとトラッカーモジュールから構成される。プランナーモジュールは、ヒューリスティックとニューラルネットワークを用いた高速逐次フィルタリングによるサンプリングベースの最適化により、物理的に実行可能な足場計画を見つける。その後、物理シミュレーションにおいてロールアウトを行い、設計されたコスト関数に関する最良の足場計画を特定し、その物理的整合性を確認する。この階層的計画モジュールは、計算効率が高く、同時に物理的に正確である。トラッカーは計画モジュールから得られた目標足場を正確に踏むことを目指します。訓練段階では、足場の目標分布は、トラッカーと競合的に訓練される生成モデルによって与えられる。このプロセスにより、トラッカーは希望する難易度の環境で確実にトレーニングされる。その結果、トラッカーは、これまでの手法では対処できなかったような困難な地形も克服することができる。私たちは、社内のダイナミック四脚ロボットであるRaiboを使って、私たちのアプローチを実証した。その結果、ダイナミックで機敏な動作が得られた:Raiboは垂直の壁を走ったり、1.3mのギャップをジャンプしたり、飛び石を秒速4mで走ったり、30{deg}のスロープや階段、様々な大きさの箱がある地形を自律的に移動したりすることができる。

要約(オリジナル)

High-speed legged navigation in discrete and geometrically complex environments is a challenging task because of the high-degree-of-freedom dynamics and long-horizon, nonconvex nature of the optimization problem. In this work, we propose a hierarchical navigation pipeline for legged robots that can traverse such environments at high speed. The proposed pipeline consists of a planner and tracker module. The planner module finds physically feasible foothold plans by sampling-based optimization with fast sequential filtering using heuristics and a neural network. Subsequently, rollouts are performed in a physics simulation to identify the best foothold plan regarding the engineered cost function and to confirm its physical consistency. This hierarchical planning module is computationally efficient and physically accurate at the same time. The tracker aims to accurately step on the target footholds from the planning module. During the training stage, the foothold target distribution is given by a generative model that is trained competitively with the tracker. This process ensures that the tracker is trained in an environment with the desired difficulty. The resulting tracker can overcome terrains that are more difficult than what the previous methods could manage. We demonstrated our approach using Raibo, our in-house dynamic quadruped robot. The results were dynamic and agile motions: Raibo is capable of running on vertical walls, jumping a 1.3-meter gap, running over stepping stones at 4 meters per second, and autonomously navigating on terrains full of 30{\deg} ramps, stairs, and boxes of various sizes.

arxiv情報

著者 Hyeongjun Kim,Hyunsik Oh,Jeongsoo Park,Yunho Kim,Donghoon Youm,Moonkyu Jung,Minho Lee,Jemin Hwangbo
発行日 2025-06-03 13:04:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | High-speed control and navigation for quadrupedal robots on complex and discrete terrain はコメントを受け付けていません

Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games

要約

民間および軍事空域における小型無人機の増加する普及は、特に無許可または悪意のあるドローンが制限区域に侵入した場合、重大な安全性とセキュリティの懸念を引き起こしている。この研究では、機敏な1対1のクアドローター追跡回避のための強化学習(RL)フレームワークを提示する。我々は、クアドローターの非線形ダイナミクスを十分に活用した高速追跡と回避操縦を可能にする、ボディレートと集団推力を指令するニューラルネットワークポリシーを訓練する。敵対的な共同学習中の非定常性と壊滅的な忘却を緩和するために、我々は非同期多段階母集団ベース(AMSPB)アルゴリズムを導入し、各段階で、追跡者または回避者のいずれかが、過去と現在のポリシーの成長集団から引き出されたサンプリングされた相手に対して学習する。この継続的な学習設定により、単調な性能向上と以前の戦略の保持が保証される。我々の結果は、(i)速度ベースの方針は、速度レベルのベースラインよりも有意に高い捕捉率とピーク速度を達成すること、(ii)AMSPBは、一連のベンチマーク相手に対して安定した単調な利得をもたらすことを示す。

要約(オリジナル)

The increasing proliferation of small UAVs in civilian and military airspace has raised critical safety and security concerns, especially when unauthorized or malicious drones enter restricted zones. In this work, we present a reinforcement learning (RL) framework for agile 1v1 quadrotor pursuit-evasion. We train neural network policies to command body rates and collective thrust, enabling high-speed pursuit and evasive maneuvers that fully exploit the quadrotor’s nonlinear dynamics. To mitigate nonstationarity and catastrophic forgetting during adversarial co-training, we introduce an Asynchronous Multi-Stage Population-Based (AMSPB) algorithm where, at each stage, either the pursuer or evader learns against a sampled opponent drawn from a growing population of past and current policies. This continual learning setup ensures monotonic performance improvement and retention of earlier strategies. Our results show that (i) rate-based policies achieve significantly higher capture rates and peak speeds than velocity-level baselines, and (ii) AMSPB yields stable, monotonic gains against a suite of benchmark opponents.

arxiv情報

著者 Alejandro Sanchez Roncero,Olov Andersson,Petter Ogren
発行日 2025-06-03 13:19:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO | Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games はコメントを受け付けていません

Tru-POMDP: Task Planning Under Uncertainty via Tree of Hypotheses and Open-Ended POMDPs

要約

実世界で活動するホームサービスロボットにとって、不確実性の下でのタスク計画は不可欠である。タスクには、曖昧な人間の指示、隠されたまたは未知のオブジェクトの位置、およびオープンボキャブラリーのオブジェクトタイプが含まれ、大きなオープンエンドの不確実性と無限に大きな計画空間をもたらす。このような課題に対処するために、我々は、大規模言語モデル(LLM)を用いた構造化信念生成と、原理的なPOMDP計画を組み合わせたプランナであるTru-POMDPを提案する。Tru-POMDPは階層的な仮説の木(Tree of Hypotheses:TOH)を導入し、LLMに体系的な問い合わせを行うことで、可能性のある世界状態と人間の目標に対する高品質な粒子信念を構築する。さらに、LLMが生成した仮説に対する厳密なベイズ信念追跡と効率的な信念空間計画を可能にするオープンエンドPOMDPモデルを定式化する。多様なキッチン環境における複雑な物体再配置タスクの実験により、Tru-POMDPは、最新のLLMベースおよびLLM-ツリー探索ハイブリッドプランナを大幅に凌駕し、より優れた計画、曖昧性やオクルージョンに対するより強い頑健性、およびより優れた計画効率により高い成功率を達成することが示された。

要約(オリジナル)

Task planning under uncertainty is essential for home-service robots operating in the real world. Tasks involve ambiguous human instructions, hidden or unknown object locations, and open-vocabulary object types, leading to significant open-ended uncertainty and a boundlessly large planning space. To address these challenges, we propose Tru-POMDP, a planner that combines structured belief generation using Large Language Models (LLMs) with principled POMDP planning. Tru-POMDP introduces a hierarchical Tree of Hypotheses (TOH), which systematically queries an LLM to construct high-quality particle beliefs over possible world states and human goals. We further formulate an open-ended POMDP model that enables rigorous Bayesian belief tracking and efficient belief-space planning over these LLM-generated hypotheses. Experiments on complex object rearrangement tasks across diverse kitchen environments show that Tru-POMDP significantly outperforms state-of-the-art LLM-based and LLM-tree-search hybrid planners, achieving higher success rates with significantly better plans, stronger robustness to ambiguity and occlusion, and greater planning efficiency.

arxiv情報

著者 Wenjing Tang,Xinyu He,Yongxi Huang,Yunxiao Xiao,Cewu Lu,Panpan Cai
発行日 2025-06-03 13:26:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO | Tru-POMDP: Task Planning Under Uncertainty via Tree of Hypotheses and Open-Ended POMDPs はコメントを受け付けていません

Automatic Operation of an Articulated Dump Truck: State Estimation by Combined QZSS CLAS and Moving-Base RTK Using Multiple GNSS Receivers

要約

建設業界では少子化による労働力不足が深刻な問題となっており,その解決策として建設作業の自動化が注目されている.本稿では、ダンプトラックの自動運転のために、複数のGNSSを用いてダンプトラックの位置・姿勢・アーティキュレーション角の状態推定を実現する手法を提案する。建設機械の自動運転にはRTK-GNSSが一般的に利用されているが、山間部ではモバイルネットワークが不安定な場合が多く、GNSS基準局を利用したRTK-GNSSは利用できない。そこで本論文では、日本の準天頂衛星システム(QZSS)のセンチメートルレベル補強サービス(CLAS)を利用することで、GNSS基準局を必要としないダンプトラックの状態推定手法を開発した。CLASはセンチメートルレベルの位置推定が可能であるが、その測位精度やアンビギュイティ修正率はRTK-GNSSよりも低い。この問題を解決するために、複数のGNSSアンテナ間でCLAS測位とムービングベースRTK-GNSSを組み合わせたファクターグラフ最適化による状態推定法を構築する。実環境下での評価試験により、提案手法は従来のRTK-GNSSと同等の精度でダンプトラックの状態を推定できることが示されたが、GNSS基準局は不要である。

要約(オリジナル)

Labor shortage due to the declining birth rate has become a serious problem in the construction industry, and automation of construction work is attracting attention as a solution to this problem. This paper proposes a method to realize state estimation of dump truck position, orientation and articulation angle using multiple GNSS for automatic operation of dump trucks. RTK-GNSS is commonly used for automation of construction equipment, but in mountainous areas, mobile networks often unstable, and RTK-GNSS using GNSS reference stations cannot be used. Therefore, this paper develops a state estimation method for dump trucks that does not require a GNSS reference station by using the Centimeter Level Augmentation Service (CLAS) of the Japanese Quasi-Zenith Satellite System (QZSS). Although CLAS is capable of centimeter-level position estimation, its positioning accuracy and ambiguity fix rate are lower than those of RTK-GNSS. To solve this problem, we construct a state estimation method by factor graph optimization that combines CLAS positioning and moving-base RTK-GNSS between multiple GNSS antennas. Evaluation tests under real-world environments have shown that the proposed method can estimate the state of dump trucks with the same accuracy as conventional RTK-GNSS, but does not require a GNSS reference station.

arxiv情報

著者 Taro Suzuki,Shotaro Kojima,Kazunori Ohno,Naoto Miyamoto,Takahiro Suzuki,Kimitaka Asano,Tomohiro Komatsu,Hiroto Kakizaki
発行日 2025-06-03 13:44:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Automatic Operation of an Articulated Dump Truck: State Estimation by Combined QZSS CLAS and Moving-Base RTK Using Multiple GNSS Receivers はコメントを受け付けていません

FlySearch: Exploring how vision-language models explore

要約

現実の世界は混乱しており、構造化されていない。重要な情報を発見するためには、しばしば能動的で目標主導型の探索が必要となる。最近、多くの困難なタスクで人気のゼロショット・ツールとして登場した視覚言語モデル(VLM)が、このような状況下で効果的に動作できるかどうかはまだわからない。本論文では、複雑なシーンでオブジェクトを検索し、ナビゲートするための3D、屋外、フォトリアリスティックな環境であるFlySearchを導入することで、この疑問に答える。我々は、難易度の異なる3つのシナリオを定義し、最先端のVLMでは、最も単純な探索タスクでさえも確実に解決できないことを観察した。我々は、幻覚から文脈の誤解、タスク計画の失敗まで、一連の中心的な原因を特定し、そのうちのいくつかは微調整によって対処可能であることを示す。ベンチマーク、シナリオ、コードベースを公開する。

要約(オリジナル)

The real world is messy and unstructured. Uncovering critical information often requires active, goal-driven exploration. It remains to be seen whether Vision-Language Models (VLMs), which recently emerged as a popular zero-shot tool in many difficult tasks, can operate effectively in such conditions. In this paper, we answer this question by introducing FlySearch, a 3D, outdoor, photorealistic environment for searching and navigating to objects in complex scenes. We define three sets of scenarios with varying difficulty and observe that state-of-the-art VLMs cannot reliably solve even the simplest exploration tasks, with the gap to human performance increasing as the tasks get harder. We identify a set of central causes, ranging from vision hallucination, through context misunderstanding, to task planning failures, and we show that some of them can be addressed by finetuning. We publicly release the benchmark, scenarios, and the underlying codebase.

arxiv情報

著者 Adam Pardyl,Dominik Matuszek,Mateusz Przebieracz,Marek Cygan,Bartosz Zieliński,Maciej Wołczyk
発行日 2025-06-03 14:03:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, cs.RO | FlySearch: Exploring how vision-language models explore はコメントを受け付けていません

Text-guided Generation of Efficient Personalized Inspection Plans

要約

我々は、テキスト記述に基づく検査計画を促進するために、訓練不要の視覚言語モデル(VLM)ガイド付き軌跡生成アプローチを提案する。未知の環境における一般的なエージェントのために設計された既存の視覚-言語ナビゲーション(VLN)手法とは異なり、我々のアプローチは、医療、海洋、土木工学などの分野で広く応用されている、既知のシーンの効率的な検査を特にターゲットとしている。VLMを活用することで、我々の手法は、まずテキスト記述から興味のあるポイント(POI)を抽出し、次にPOIが顕著であり、かつプロンプトで定義された空間的制約に合致するウェイポイントの集合を特定する。次に、VLMと対話し、POIの可視性と顕著性を維持しながら、軌跡を繰り返し改良する。さらに、巡回セールスマン問題(TSP)を解いて、テキスト記述に含意された順序制約を満たす最も効率的な訪問順序を見つける。最後に、軌道最適化を適用して、空中・水中車両のための滑らかで実行可能な検査経路を生成する。我々は、手作業と実世界のスキャン環境の両方において、本手法を評価した。その結果、我々のアプローチが、ユーザの指示に忠実な検査計画軌道を効果的に生成することが実証された。

要約(オリジナル)

We propose a training-free, Vision-Language Model (VLM)-guided approach for efficiently generating trajectories to facilitate target inspection planning based on text descriptions. Unlike existing Vision-and-Language Navigation (VLN) methods designed for general agents in unknown environments, our approach specifically targets the efficient inspection of known scenes, with widespread applications in fields such as medical, marine, and civil engineering. Leveraging VLMs, our method first extracts points of interest (POIs) from the text description, then identifies a set of waypoints from which POIs are both salient and align with the spatial constraints defined in the prompt. Next, we interact with the VLM to iteratively refine the trajectory, preserving the visibility and prominence of the POIs. Further, we solve a Traveling Salesman Problem (TSP) to find the most efficient visitation order that satisfies the order constraint implied in the text description. Finally, we apply trajectory optimization to generate smooth, executable inspection paths for aerial and underwater vehicles. We have evaluated our method across a series of both handcrafted and real-world scanned environments. The results demonstrate that our approach effectively generates inspection planning trajectories that adhere to user instructions.

arxiv情報

著者 Xingpeng Sun,Zherong Pan,Xifeng Gao,Kui Wu,Aniket Bera
発行日 2025-06-03 14:18:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Text-guided Generation of Efficient Personalized Inspection Plans はコメントを受け付けていません

Functionality Assessment Framework for Autonomous Driving Systems using Subjective Networks

要約

複雑な自律走行(AD)ソフトウェアシステムでは、各システム部品の機能が安全運転に不可欠である。個々のコンポーネントの現在の機能性または操作性を測定することで、システムを分離して垣間見ることができる。文献には、このような分離された評価がいくつか掲載されており、多くの場合、安全性や性能の測定という形で示されている。しかし、依存関係、冗長性、エラーの伝播、相反する機能性の記述は、これらの測定値をADスタック全体の機能の全体像に簡単に組み合わせることを許さない。データは異なるコンポーネント間で処理・交換され、それぞれが故障する可能性があり、全体的なステートメントを困難なものにしている。これらの問題に取り組む機能性評価フレームワークの欠如は、この複雑さを強調している。 本稿では、複雑なコンポーネントベースのシステムに対して、それらの依存関係、冗長性、エラー伝播経路、および個々のコンポーネントの評価を考慮することにより、全体的な機能性ステートメントを推論するための新しいフレームワークを提示する。我々のフレームワークは、まずシステムの評価表現への包括的な変換を組み込む。この表現は主観的ネットワーク(SN)に基づいており、欠陥のあるシステム部品を容易に特定することができる。第二に、このフレームワークは、同じコンポーネントに関する相反する評価や、システムの依存関係や冗長性を扱いながら、システムの機能を計算するための柔軟な方法を提供する。我々は、様々なコンポーネントの評価を持つ我々のADスタックの実データを用いて、フレームワークの機能について議論する。

要約(オリジナル)

In complex autonomous driving (AD) software systems, the functioning of each system part is crucial for safe operation. By measuring the current functionality or operability of individual components an isolated glimpse into the system is given. Literature provides several of these detached assessments, often in the form of safety or performance measures. But dependencies, redundancies, error propagation and conflicting functionality statements do not allow for easy combination of these measures into a big picture of the functioning of the entire AD stack. Data is processed and exchanged between different components, each of which can fail, making an overall statement challenging. The lack of functionality assessment frameworks that tackle these problems underlines this complexity. This article presents a novel framework for inferring an overall functionality statement for complex component based systems by considering their dependencies, redundancies, error propagation paths and the assessments of individual components. Our framework first incorporates a comprehensive conversion to an assessment representation of the system. The representation is based on Subjective Networks (SNs) that allow for easy identification of faulty system parts. Second, the framework offers a flexible method for computing the system’s functionality while dealing with contradicting assessments about the same component and dependencies, as well as redundancies, of the system. We discuss the framework’s capabilities on real-life data of our AD stack with assessments of various components.

arxiv情報

著者 Stefan Orf,Sven Ochs,Valentin Marotta,Oliver Conder,Marc René Zofka,J. Marius Zöllner
発行日 2025-06-03 14:24:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Functionality Assessment Framework for Autonomous Driving Systems using Subjective Networks はコメントを受け付けていません

Online Performance Assessment of Multi-Source-Localization for Autonomous Driving Systems Using Subjective Logic

要約

自律走行(AD)は、すべての走行関連ソフトウェアコンポーネントの重要な部分として、高精度の位置特定に大きく依存している。正確な測位は、高精細地図の利用、他の道路参加者の予測、車両自体の制御のために必要です。このような理由から、ローカライゼーションは絶対的に安全性に関係しています。ローカライゼーションシステムの典型的なエラーは、長時間のドリフト、ジャンプ、誤ローカライゼーションであり、安全性を高めるために検出する必要があります。現在のローカライゼーション性能をオンラインで評価することは困難なタスクであり、通常、単一のローカライゼーションシステムではカルマンフィルタリングによって行われます。現在の自律走行車は、複数の個別定位手法を融合して全体的な状態推定を行うことで、こうした課題に対処している。このようなアプローチは、困難な環境において競争力を発揮するために専門家の知識が必要です。この専門的知識は、現在の状況や環境に対する個別の定位手法の信頼性と優先順位付けに基づいている。 本研究では、主観的論理(SL)を用いた、複数のローカライゼーションシステムの新しいオンライン性能評価技術を紹介します。我々の研究車両では、オドメトリ、SLAM(Simultaneous Localization And Mapping)、GNSS(Global Navigation Satellite System)ベースの3つの異なる定位システムが利用可能である。この性能評価では、これら3つの定位システムの挙動を個別にモデル化し、相互に参照させる。実験は、アウディA6をベースとしたCoCar NextGenを用いて実施した。車両のローカライゼーション・システムは、特にトンネル環境という厳しい条件下で評価された。総合評価では、我々のアプローチの実現可能性が示された。

要約(オリジナル)

Autonomous driving (AD) relies heavily on high precision localization as a crucial part of all driving related software components. The precise positioning is necessary for the utilization of high-definition maps, prediction of other road participants and the controlling of the vehicle itself. Due to this reason, the localization is absolutely safety relevant. Typical errors of the localization systems, which are long term drifts, jumps and false localization, that must be detected to enhance safety. An online assessment and evaluation of the current localization performance is a challenging task, which is usually done by Kalman filtering for single localization systems. Current autonomous vehicles cope with these challenges by fusing multiple individual localization methods into an overall state estimation. Such approaches need expert knowledge for a competitive performance in challenging environments. This expert knowledge is based on the trust and the prioritization of distinct localization methods in respect to the current situation and environment. This work presents a novel online performance assessment technique of multiple localization systems by using subjective logic (SL). In our research vehicles, three different systems for localization are available, namely odometry-, Simultaneous Localization And Mapping (SLAM)- and Global Navigation Satellite System (GNSS)-based. Our performance assessment models the behavior of these three localization systems individually and puts them into reference of each other. The experiments were carried out using the CoCar NextGen, which is based on an Audi A6. The vehicle’s localization system was evaluated under challenging conditions, specifically within a tunnel environment. The overall evaluation shows the feasibility of our approach.

arxiv情報

著者 Stefan Orf,Sven Ochs,Marc René Zofka,J. Marius Zöllner
発行日 2025-06-03 14:34:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Online Performance Assessment of Multi-Source-Localization for Autonomous Driving Systems Using Subjective Logic はコメントを受け付けていません

UniConFlow: A Unified Constrained Generalization Framework for Certified Motion Planning with Flow Matching Models

要約

生成モデルは、様々なタスクにおいて柔軟でマルチモーダルな軌道生成を可能にし、ロボット動作生成のためのますます強力なツールとなっている。しかし、既存のアプローチの多くは、衝突回避や動的整合性などの複数の種類の制約を扱うことに限界があり、これらはしばしば別々に扱われるか、部分的にしか考慮されていない。本論文では、等式制約と不等式制約の両方を体系的に組み込んだ、軌跡生成のための統一されたフローマッチング(FM)ベースのフレームワークであるUniConFlowを提案する。UniConFlowは、新しい規定時間ゼロ化関数を導入し、推論プロセス中の柔軟性を向上させ、モデルが様々なタスク要求に適応できるようにする。特に障害物回避、許容行動範囲、キノダイナミック一貫性に関して制約を満足させるために、FMモデルへの誘導入力は二次計画定式化により導出され、再トレーニングや補助制御器を必要とせずに制約を考慮した生成を可能にする。我々は、移動ナビゲーションと高次元操作タスクを実施し、最新の制約付き生成プランナーと比較して、安全性と実現可能性が向上していることを実証している。プロジェクトページはhttps://uniconflow.github.io。

要約(オリジナル)

Generative models have become increasingly powerful tools for robot motion generation, enabling flexible and multimodal trajectory generation across various tasks. Yet, most existing approaches remain limited in handling multiple types of constraints, such as collision avoidance and dynamic consistency, which are often treated separately or only partially considered. This paper proposes UniConFlow, a unified flow matching (FM) based framework for trajectory generation that systematically incorporates both equality and inequality constraints. UniConFlow introduces a novel prescribed-time zeroing function to enhance flexibility during the inference process, allowing the model to adapt to varying task requirements. To ensure constraint satisfaction, particularly with respect to obstacle avoidance, admissible action range, and kinodynamic consistency, the guidance inputs to the FM model are derived through a quadratic programming formulation, which enables constraint-aware generation without requiring retraining or auxiliary controllers. We conduct mobile navigation and high-dimensional manipulation tasks, demonstrating improved safety and feasibility compared to state-of-the-art constrained generative planners. Project page is available at https://uniconflow.github.io.

arxiv情報

著者 Zewen Yang,Xiaobing Dai,Dian Yu,Qianru Li,Yu Li,Valentin Le Mesle
発行日 2025-06-03 14:48:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO | UniConFlow: A Unified Constrained Generalization Framework for Certified Motion Planning with Flow Matching Models はコメントを受け付けていません

Learning Collision Risk from Naturalistic Driving with Generalised Surrogate Safety Measures

要約

ドライバーや自動運転システムに対して、発生する衝突を正確かつタイムリーに警告することは、交通安全、特に双方向性の高い都市交通における課題である。既存のアプローチでは、疎なリスクの注釈に多大な労力を要したり、様々な文脈要因を考慮するのに苦労したり、あるいは設計されたシナリオにしか役立たなかったりする。これらの限界に対処するため、本研究では、衝突やリスクのラベルを付けずに、自然な運転のみから学習する新しいアプローチである一般化代替安全指標(GSSM)を導入する。GSSMは通常の運転のパターンを捉え、ある交通相互作用が規範からどの程度逸脱し、安全でない極端な方向に向かうかを推定する。ニューラルネットワークを利用することで、通常の相互作用は、道路利用者間の多方向間隔の文脈条件付き分布によって特徴付けられる。同じ相互作用の文脈では、通常よりも車間距離が近いほど、潜在的な衝突のリスクが高くなる。そして、コンテキストに適応したリスクスコアとそれに関連する確率は、極値の理論に基づいて計算することができる。運動学、天候、照明などの測定可能な要素はコンテキストの一部となり、安全上重要な相互作用を多様にカバーすることができる。GSSMを訓練するために複数の公開運転データセットが使用され、SHRP2 NDSから再構成された2,591件の実際の衝突事故とニアクラッシュでテストされる。瞬間的な状態のみを使用するバニラGSSMは、AUPRC 0.9を達成し、衝突の可能性を防ぐための中央値2.6秒の時間前進を確保した。付加的なデータとコンテクスト要因によって、さらに性能が向上する。追突、合流、交差などの様々な相互作用のタイプにわたって、GSSMの精度と適時性は一貫して既存のベースラインを上回る。したがって、GSSMは、交通相互作用における衝突リスクを事前に定量化するための、スケーラブルで、コンテキストを認識し、一般化可能な基盤を確立します。

要約(オリジナル)

Accurate and timely alerts for drivers or automated systems to unfolding collisions remains a challenge in road safety, particularly in highly interactive urban traffic. Existing approaches require labour-intensive annotation of sparse risk, struggle to consider varying contextual factors, or are useful only in the scenarios they are designed for. To address these limits, this study introduces the generalised surrogate safety measure (GSSM), a new approach that learns exclusively from naturalistic driving without crash or risk labels. GSSM captures the patterns of normal driving and estimates the extent to which a traffic interaction deviates from the norm towards unsafe extreme. Utilising neural networks, normal interactions are characterised by context-conditioned distributions of multi-directional spacing between road users. In the same interaction context, a spacing closer than normal entails higher risk of potential collision. Then a context-adaptive risk score and its associated probability can be calculated based on the theory of extreme values. Any measurable factors, such as motion kinematics, weather, lighting, can serve as part of the context, allowing for diverse coverage of safety-critical interactions. Multiple public driving datasets are used to train GSSMs, which are tested with 2,591 real-world crashes and near-crashes reconstructed from the SHRP2 NDS. A vanilla GSSM using only instantaneous states achieves AUPRC of 0.9 and secures a median time advance of 2.6 seconds to prevent potential collisions. Additional data and contextual factors provide further performance gains. Across various interaction types such as rear-end, merging, and crossing, the accuracy and timeliness of GSSM consistently outperforms existing baselines. GSSM therefore establishes a scalable, context-aware, and generalisable foundation to proactively quantify collision risk in traffic interactions.

arxiv情報

著者 Yiru Jiao,Simeon C. Calvert,Sander van Cranenburgh,Hans van Lint
発行日 2025-06-03 15:47:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO | Learning Collision Risk from Naturalistic Driving with Generalised Surrogate Safety Measures はコメントを受け付けていません