ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks

要約

高品質のベンチマークは、具体化されたAI研究の基盤であり、長老航海、操作、および再配置タスクの大幅な進歩を可能にします。
ただし、ロボット工学のフロンティアタスクがより高度になるにつれて、シミュレーション速度の高速化、より複雑なテスト環境、およびより大きなデモンストレーションデータセットが必要です。
この目的のために、MS-HABは、低レベルの操作と在宅オブジェクトの再配置のための全体的なベンチマークであるMS-HABを提示します。
まず、ホームアシスタントベンチマーク(HAB)のGPUアクセル化された実装を提供します。
現実的な低レベルのコントロールをサポートし、GPUメモリ使用量の一部での以前の魔法の把握実装の速度を3倍以上に達成します。
第二に、将来の作業を比較するために、広範な強化学習(RL)および模倣学習(IL)ベースラインを訓練します。
最後に、ロボットの行動と安全性の事前定義された基準に一致するRLポリシーから特定のデモンストレーションをサンプリングするためのルールベースの軌道フィルタリングシステムを開発します。
デモンストレーションフィルタリングと高速環境を組み合わせることで、大規模な効率的で制御されたデータ生成が可能になります。

要約(オリジナル)

High-quality benchmarks are the foundation for embodied AI research, enabling significant advancements in long-horizon navigation, manipulation and rearrangement tasks. However, as frontier tasks in robotics get more advanced, they require faster simulation speed, more intricate test environments, and larger demonstration datasets. To this end, we present MS-HAB, a holistic benchmark for low-level manipulation and in-home object rearrangement. First, we provide a GPU-accelerated implementation of the Home Assistant Benchmark (HAB). We support realistic low-level control and achieve over 3x the speed of prior magical grasp implementations at a fraction of the GPU memory usage. Second, we train extensive reinforcement learning (RL) and imitation learning (IL) baselines for future work to compare against. Finally, we develop a rule-based trajectory filtering system to sample specific demonstrations from our RL policies which match predefined criteria for robot behavior and safety. Combining demonstration filtering with our fast environments enables efficient, controlled data generation at scale.

arxiv情報

著者 Arth Shukla,Stone Tao,Hao Su
発行日 2025-02-28 10:10:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks はコメントを受け付けていません

Learning Quiet Walking for a Small Home Robot

要約

ホームロボット工学が牽引力を獲得するにつれて、ロボットはますます世帯に統合され、交際と支援を提供します。
四足動物、特に犬に似たロボットは、伝統的なペットの人気のある代替品として浮上しています。
ただし、ユーザーのフィードバックは、これらのロボットが自宅で歩いているときに生成するノイズ、特に大きな足音の音に関する懸念を強調しています。
この問題に対処するために、SIM-to-Realベースの強化学習(RL)アプローチを提案して、足音の音に非常に関連するフット接触速度を最小限に抑えます。
私たちのフレームワークには、3つの重要な要素が組み込まれています。さまざまなPDゲインを学習して、各ジョイントを積極的に減衰させて硬化させ、足の接触センサーを利用し、カリキュラム学習を使用して足接触速度の罰則を徐々に実施します。
実験は、学習したポリシーがRLベースラインや慎重に手作りのソニー商業コントローラーと比較して優れた静けさを達成することを示しています。
さらに、堅牢性と静かさの間のトレードオフが示されています。
この研究は、家庭環境でより静かでユーザーフレンドリーなロボットの仲間の開発に貢献しています。

要約(オリジナル)

As home robotics gains traction, robots are increasingly integrated into households, offering companionship and assistance. Quadruped robots, particularly those resembling dogs, have emerged as popular alternatives for traditional pets. However, user feedback highlights concerns about the noise these robots generate during walking at home, particularly the loud footstep sound. To address this issue, we propose a sim-to-real based reinforcement learning (RL) approach to minimize the foot contact velocity highly related to the footstep sound. Our framework incorporates three key elements: learning varying PD gains to actively dampen and stiffen each joint, utilizing foot contact sensors, and employing curriculum learning to gradually enforce penalties on foot contact velocity. Experiments demonstrate that our learned policy achieves superior quietness compared to a RL baseline and the carefully handcrafted Sony commercial controllers. Furthermore, the trade-off between robustness and quietness is shown. This research contributes to developing quieter and more user-friendly robotic companions in home environments.

arxiv情報

著者 Ryo Watanabe,Takahiro Miki,Fan Shi,Yuki Kadokawa,Filip Bjelonic,Kento Kawaharazuka,Andrei Cramariuc,Marco Hutter
発行日 2025-02-28 10:41:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning Quiet Walking for a Small Home Robot はコメントを受け付けていません

Motion ReTouch: Motion Modification Using Four-Channel Bilateral Control

要約

最近の研究では、自律的なロボット操作における模倣学習の有用性が実証されています。
特に、位置を取得して力情報を取得できる4チャンネルの二国間コントロールを使用した教育は、効果的であることが証明されています。
ただし、一度に高速で複雑なタスクを簡単に実行できるコントロールパフォーマンスはまだ達成されていません。
Motion Retouchと呼ばれるメソッドを提案します。これは、4チャンネルの両側制御を使用して取得したモーションデータを遡及的に変更します。
提案された方法により、位置だけでなく強制情報の変更が可能になります。
これは、多国間制御とモーションコピーシステムの組み合わせによって達成されました。
提案された方法は、実際のロボットを使用した実験で検証され、試験管転送タスクの成功率が改善され、修正力情報の可能性が示されました。

要約(オリジナル)

Recent research has demonstrated the usefulness of imitation learning in autonomous robot operation. In particular, teaching using four-channel bilateral control, which can obtain position and force information, has been proven effective. However, control performance that can easily execute high-speed, complex tasks in one go has not yet been achieved. We propose a method called Motion ReTouch, which retroactively modifies motion data obtained using four-channel bilateral control. The proposed method enables modification of not only position but also force information. This was achieved by the combination of multilateral control and motion-copying system. The proposed method was verified in experiments with a real robot, and the success rate of the test tube transfer task was improved, demonstrating the possibility of modification force information.

arxiv情報

著者 Koki Inami,Sho Sakaino,Toshiaki Tsuji
発行日 2025-02-28 11:50:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Motion ReTouch: Motion Modification Using Four-Channel Bilateral Control はコメントを受け付けていません

S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM

要約

3Dシーングラフの階層構造は、人工環境からの一般的なパターンに適合するため、表現目的に高い関連性を示しています。
しかし、さらに、このような階層表現のセマンティックおよび幾何学的情報を活用して、マップ要素とロボットポーズの最適化と管理を高速化することができます。
この方向には、効率的なデータ管理と最適化のために屋内シーンの階層構造を活用する作業状況グラフ2.0(S-Graphs 2.0)を提示します。
私たちのアルゴリズムは、環境を4つのレイヤーに表す状況グラフを構築することから始まります。キーフレーム、壁、部屋、床です。
私たちの最初の斬新さは、階段を識別し、基礎となる層に床レベルのセマンティック関係を割り当てることができる床検出モジュールを含むフロントエンドにあります。
フロアレベルのセマンティクスを使用すると、フロアベースのループ閉鎖戦略を提案することができます。これは、建物の異なるフロア間のエイリアシングのために通常表示される誤検知陽性閉鎖を効果的に拒否します。
私たちの2番目のノベルティは、最適化における表現階層を活用することにあります。
私たちの提案は、(1)4つの表現層にわたる最近のキーフレームと接続されたコンポーネントのウィンドウ上のローカル最適化、(2)フロアレベルのグローバルな最適化。これは、ループ閉鎖中のキーフレームと現在のフロア内の接続のみに焦点を当てており、(3)部屋レベルのローカル最適化、room ridundant keyframesの疎外されたキーフレームがroomを共有します。
さまざまな実際のマルチフロア環境でアルゴリズムを広範囲に検証します。
私たちのアプローチは、競合するベースラインよりも平均して、平均で最大10倍高速な階層表現を推定する大規模なマルチフロア環境における最先端の精度メトリックを示しています。

要約(オリジナル)

The hierarchical structure of 3D scene graphs shows a high relevance for representations purposes, as it fits common patterns from man-made environments. But, additionally, the semantic and geometric information in such hierarchical representations could be leveraged to speed up the optimization and management of map elements and robot poses. In this direction, we present our work Situational Graphs 2.0 (S-Graphs 2.0), which leverages the hierarchical structure of indoor scenes for efficient data management and optimization. Our algorithm begins by constructing a situational graph that represents the environment into four layers: Keyframes, Walls, Rooms, and Floors. Our first novelty lies in the front-end, which includes a floor detection module capable of identifying stairways and assigning floor-level semantic relations to the underlying layers. Floor-level semantics allows us to propose a floor-based loop closure strategy, that effectively rejects false positive closures that typically appear due to aliasing between different floors of a building. Our second novelty lies in leveraging our representation hierarchy in the optimization. Our proposal consists of: (1) local optimization over a window of recent keyframes and their connected components across the four representation layers, (2) floor-level global optimization, which focuses only on keyframes and their connections within the current floor during loop closures, and (3) room-level local optimization, marginalizing redundant keyframes that share observations within the room, which reduces the computational footprint. We validate our algorithm extensively in different real multi-floor environments. Our approach shows state-of-art-art accuracy metrics in large-scale multi-floor environments, estimating hierarchical representations up to 10x faster, in average, than competing baselines

arxiv情報

著者 Hriday Bavle,Jose Luis Sanchez-Lopez,Muhammad Shaheer,Javier Civera,Holger Voos
発行日 2025-02-28 12:23:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SE | S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM はコメントを受け付けていません

Nano Drone-based Indoor Crime Scene Analysis

要約

ロボット工学、人工知能(AI)、コンピュータービジョン(CV)などの技術を犯罪現場分析(CSA)に適用して、命を保護し、正義を促進し、犯罪を阻止することができますが、自動化できるタスクの概要は不足しています。
ここでは、プロトタイピングのアプローチに従います。まず、階段ツールを使用して、窓から犯罪サイトにアクセスし、証拠をマッピング/収集する、血液塗抹標本の分析など、あまり注意を払っていないように見えるタスクを迅速にレビューし、特定のタスクを特定します。
第二に、これら3つのタスクを75%、85%、および80%のパフォーマンスで実装する小さなドローンのプロトタイプを提示し、屋内犯罪現場の最小分析を実行します。
学んだ教訓は、この地域での次の作業を導くために報告されています。

要約(オリジナル)

Technologies such as robotics, Artificial Intelligence (AI), and Computer Vision (CV) can be applied to crime scene analysis (CSA) to help protect lives, facilitate justice, and deter crime, but an overview of the tasks that can be automated has been lacking. Here we follow a speculate prototyping approach: First, the STAIR tool is used to rapidly review the literature and identify tasks that seem to have not received much attention, like accessing crime sites through a window, mapping/gathering evidence, and analyzing blood smears. Secondly, we present a prototype of a small drone that implements these three tasks with 75%, 85%, and 80% performance, to perform a minimal analysis of an indoor crime scene. Lessons learned are reported, toward guiding next work in the area.

arxiv情報

著者 Martin Cooney,Sivadinesh Ponrajan,Fernando Alonso-Fernandez
発行日 2025-02-28 13:04:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Nano Drone-based Indoor Crime Scene Analysis はコメントを受け付けていません

Sixth-Sense: Self-Supervised Learning of Spatial Awareness of Humans from a Planar Lidar

要約

人間のローカライズは、人々に近接して動作するサービスロボットにとって重要な前提条件です。
これらのシナリオでは、ロボットは通常、RGB-Dカメラまたは高価な3Dライダーで動作するように設計された最先端の多数の検出器に依存しています。
ただし、ほとんどの市販のサービスロボットには、狭い視野のカメラが装備されており、ユーザーが他の方向から近づいているときに盲目になります。
これらの制限に対処するために、監督ソースとしてRGB-Dカメラからの検出を使用して、人間を検出し、1D LIDARデータからの2Dポーズを推定するための自己監視アプローチを提案します。
私たちのアプローチは、近くの人間の空間的認識をサービスロボットに提供することを目的としています。
2つの環境で自律的に収集された70分間のデータでトレーニングした後、私たちのモデルは、71%の精度と80%のリコールで、新しい環境で1D Lidarデータから人間を全方向に検出することができ、距離は13 cm、44 {\ deg}の平均絶対誤差を保持します。

要約(オリジナル)

Localizing humans is a key prerequisite for any service robot operating in proximity to people. In these scenarios, robots rely on a multitude of state-of-the-art detectors usually designed to operate with RGB-D cameras or expensive 3D LiDARs. However, most commercially available service robots are equipped with cameras with a narrow field of view, making them blind when a user is approaching from other directions, or inexpensive 1D LiDARs whose readings are difficult to interpret. To address these limitations, we propose a self-supervised approach to detect humans and estimate their 2D pose from 1D LiDAR data, using detections from an RGB-D camera as a supervision source. Our approach aims to provide service robots with spatial awareness of nearby humans. After training on 70 minutes of data autonomously collected in two environments, our model is capable of detecting humans omnidirectionally from 1D LiDAR data in a novel environment, with 71% precision and 80% recall, while retaining an average absolute error of 13 cm in distance and 44{\deg} in orientation.

arxiv情報

著者 Simone Arreghini,Nicholas Carlotti,Mirko Nava,Antonio Paolillo,Alessandro Giusti
発行日 2025-02-28 13:22:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Sixth-Sense: Self-Supervised Learning of Spatial Awareness of Humans from a Planar Lidar はコメントを受け付けていません

Vibrotactile information coding strategies for a body-worn vest to aid robot-human collaboration

要約

このペーパーでは、ロボットからオペレーターにリアルタイムの情報を伝えるために、体で覆われた振動型のベストの使用について説明します。
Vibrotactile通信は、人の視覚的または聴覚的認識をコンプロップまたはロードすることなく、情報を提供するのに役立ちます。
このペーパーでは、ロボットと一緒に働く人間が高い認知負荷条件で動作する可能性が高い都市捜索救助(USAR)シナリオのアプリケーションを検討しています。
焦点は、ロボットがスカウトとしてリモートで動作しているシナリオでシーンの理解を強化するために、さまざまな振動型情報コーディング戦略を考慮して情報を伝える最善の方法を理解することです。
情報表現を探索する際に、このペーパーでは、特定のイベントを表す形状とパターンを使用して、スキンがスクリーンであるかのように、セマンティックハプティックスを紹介し、これらがどのようにしてベッターの学習可能性と予測の精度につながるかを示します。

要約(オリジナル)

This paper explores the use of a body-worn vibrotactile vest to convey real-time information from robot to operator. Vibrotactile communication could be useful in providing information without compropmising or loading a person’s visual or auditory perception. This paper considers applications in Urban Search and Rescue (USAR) scenarios where a human working alongside a robot is likely to be operating in high cognitive load conditions. The focus is on understanding how best to convey information considering different vibrotactile information coding strategies to enhance scene understanding in scenarios where a robot might be operating remotely as a scout. In exploring information representation, this paper introduces Semantic Haptics, using shapes and patterns to represent certain events as if the skin was a screen, and shows how these lead to bettter learnability and interpreation accuracy.

arxiv情報

著者 Adrian Vecina Tercero,Praminda Caleb-Solly
発行日 2025-02-28 13:57:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Vibrotactile information coding strategies for a body-worn vest to aid robot-human collaboration はコメントを受け付けていません

Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control

要約

実用的な制御システムは、システムモデルの不確実性と外部障害のために、最適な制御ポリシーを特定する上で重要な課題をもたらします。
$ h_ \ infty $制御手法は、一般的に乱れの効果を軽減する堅牢なコントローラーを設計するために使用されますが、これらの方法は複雑で計算集約的な計算を必要とすることがよくあります。
この問題に対処するために、このペーパーでは、2プレイヤーのゼロサムダイナミックゲームとして$ h_ \ infty $コントロールの問題を定式化する堅牢な決定論的ポリシー勾配(RDPG)と呼ばれる強化学習アルゴリズムを提案します。
この策定では、1人のプレイヤー(ユーザー)がコストを最小限に抑えることを目指していますが、他のプレイヤー(敵)はそれを最大化しようとします。
次に、決定論的政策勾配(DPG)とその深い強化学習のカウンターパートを使用して、効果的な妨害減衰を伴う堅牢な制御ポリシーを訓練します。
特に、実用的な実装のために、深いニューラルネットワークアーキテクチャを採用し、双子に耐えられた深い決定論的ポリシー勾配(TD3)の技術を統合して安定性と学習効率を高めるための技術を統合する、実用的な実装のために、堅牢な深い決定論的ポリシー勾配(RDDPG)を紹介します。
提案されたアルゴリズムを評価するために、妨害が発生しやすい環境で事前に定義されたパスに従うことを担当する無人航空機(UAV)に実装します。
実験結果は、提案された方法が、乱れに対する堅牢性の観点から他の制御アプローチを上回ることを示しており、深刻な妨害条件下でも移動ターゲットの正確なリアルタイム追跡を可能にします。

要約(オリジナル)

Practical control systems pose significant challenges in identifying optimal control policies due to uncertainties in the system model and external disturbances. While $H_\infty$ control techniques are commonly used to design robust controllers that mitigate the effects of disturbances, these methods often require complex and computationally intensive calculations. To address this issue, this paper proposes a reinforcement learning algorithm called Robust Deterministic Policy Gradient (RDPG), which formulates the $H_\infty$ control problem as a two-player zero-sum dynamic game. In this formulation, one player (the user) aims to minimize the cost, while the other player (the adversary) seeks to maximize it. We then employ deterministic policy gradient (DPG) and its deep reinforcement learning counterpart to train a robust control policy with effective disturbance attenuation. In particular, for practical implementation, we introduce an algorithm called robust deep deterministic policy gradient (RDDPG), which employs a deep neural network architecture and integrates techniques from the twin-delayed deep deterministic policy gradient (TD3) to enhance stability and learning efficiency. To evaluate the proposed algorithm, we implement it on an unmanned aerial vehicle (UAV) tasked with following a predefined path in a disturbance-prone environment. The experimental results demonstrate that the proposed method outperforms other control approaches in terms of robustness against disturbances, enabling precise real-time tracking of moving targets even under severe disturbance conditions.

arxiv情報

著者 Taeho Lee,Donghwan Lee
発行日 2025-02-28 13:58:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control はコメントを受け付けていません

Less Is More: Robust Robot Learning via Partially Observable Multi-Agent Reinforcement Learning

要約

多くのマルチエージェントおよび高次元のロボットタスクでは、コントローラーは、単一エージェント補強学習(SARL)またはマルチエージェント補強学習(MARL)のいずれかを使用して、中央または沈降することができます。
ただし、これら2つのパラダイム間の関係は十分に研究されていません。
この作業は、同じタスクでのSARLとMARLの堅牢性とパフォーマンスを体系的に調査することを目的としています。
最初に、政策勾配ベースのSARLとMARLによって最適化された独立したガウス政策が、フルステートの観察下で同等であることを分析的に示します。
それに続いて、特定の本質的に単一エージェントタスクでは、おそらく驚くべきことに、複数のエージェントを使用してロボットを制御できることを示しています。
これらの場合、エージェントは完全な状態情報に依存しないため、マルチエージェントポリシーは摂動と障害に追加の堅牢性を提供できます。
実験的な分散型制御タスクと実際のロボットを使用したモバイル操作タスクに関する実験は、部分観測にアクセスできる複数のエージェントがシステムの一部が失敗したときに単一のエージェントよりも優れていることを示しています。

要約(オリジナル)

In many multi-agent and high-dimensional robotic tasks, controllers can be optimized centrally or decentrally, using either single-agent reinforcement learning (SARL) or multi-agent reinforcement learning (MARL). However, the relationship between these two paradigms is not well-studied. This work aims to systematically investigate the robustness and performance of SARL and MARL in the same task. We first analytically show that independent Gaussian policies optimized by policy-gradient based SARL and MARL are equivalent under full-state observations. Following, we empirically show that in certain inherently single-agent tasks, perhaps surprisingly, we can use multiple agents to control a robot such that each agent only has access to partial observations. Since in these cases an agent does not depend on full state information multi-agent policies can provide additional robustness to perturbations and failures. Experiments on an illustrative decentralized control task and a mobile manipulation task with a real robot show that multiple agents with access to partial observations outperform a single agent when parts of the system fail.

arxiv情報

著者 Wenshuai Zhao,Eetu-Aleksi Rantala,Sahar Salimpour,Joni Pajarinen,Jorge Peña Queralta
発行日 2025-02-28 14:28:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Less Is More: Robust Robot Learning via Partially Observable Multi-Agent Reinforcement Learning はコメントを受け付けていません

AuthSim: Towards Authentic and Effective Safety-critical Scenario Generation for Autonomous Driving Tests

要約

敵対的な安全性シナリオを生成することは、潜在的な弱点を特定し、システムの堅牢性と信頼性を高めるため、自律運転システムをテストするための極めて重要な方法です。
しかし、既存のアプローチは、主に無制限の衝突シナリオを強調し、非プレイヤーキャラクター(NPC)車両にエゴ車両を無差別に攻撃するよう促します。
これらの作品は、これらのシナリオの信頼性、合理性、および関連性を見落としており、その結果、積極的なNPC車両が関与する多数の極端で不自然な、そして大部分が非現実的な衝突イベントをもたらします。
この問題を是正するために、3層相対安全性領域モデルを提案します。これは、危険レベルに基づいて面積を分割し、NPC車両が相対境界領域に入る可能性を高めます。
このモデルは、NPC車両に、比較的安全な境界領域内で敵対的な行動をとるように指示し、それによりシナリオの信頼性を増強します。
3層の相対安全領域モデルを強化学習と統合することにより、本物の効果的な安全性クリティカルなシナリオを生成するための包括的なプラットフォームであるAuthsimを紹介します。
私たちの知る限り、これは自律運転システムテストシナリオの信頼性と有効性に包括的に対処する最初の試みです。
広範な実験は、Authsimが効果的な安全性クリティカルシナリオを生成する際に既存の方法を上回ることを示しています。
特に、AuthSIMは、既存の方法と比較して効果的な安全性批判シナリオを生成する際のより高い効率を維持しながら、平均遮断距離が5.25%改善され、平均衝突間隔時間が27.12%の強化を達成します。
これは、現在の方法論よりも本物のシナリオを作成する際の重要な利点を強調しています。

要約(オリジナル)

Generating adversarial safety-critical scenarios is a pivotal method for testing autonomous driving systems, as it identifies potential weaknesses and enhances system robustness and reliability. However, existing approaches predominantly emphasize unrestricted collision scenarios, prompting non-player character (NPC) vehicles to attack the ego vehicle indiscriminately. These works overlook these scenarios’ authenticity, rationality, and relevance, resulting in numerous extreme, contrived, and largely unrealistic collision events involving aggressive NPC vehicles. To rectify this issue, we propose a three-layer relative safety region model, which partitions the area based on danger levels and increases the likelihood of NPC vehicles entering relative boundary regions. This model directs NPC vehicles to engage in adversarial actions within relatively safe boundary regions, thereby augmenting the scenarios’ authenticity. We introduce AuthSim, a comprehensive platform for generating authentic and effective safety-critical scenarios by integrating the three-layer relative safety region model with reinforcement learning. To our knowledge, this is the first attempt to address the authenticity and effectiveness of autonomous driving system test scenarios comprehensively. Extensive experiments demonstrate that AuthSim outperforms existing methods in generating effective safety-critical scenarios. Notably, AuthSim achieves a 5.25% improvement in average cut-in distance and a 27.12% enhancement in average collision interval time, while maintaining higher efficiency in generating effective safety-critical scenarios compared to existing methods. This underscores its significant advantage in producing authentic scenarios over current methodologies.

arxiv情報

著者 Yukuan Yang,Xucheng Lu,Zhili Zhang,Zepeng Wu,Guoqi Li,Lingzhong Meng,Yunzhi Xue
発行日 2025-02-28 14:38:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | AuthSim: Towards Authentic and Effective Safety-critical Scenario Generation for Autonomous Driving Tests はコメントを受け付けていません