Scenario-Based Curriculum Generation for Multi-Agent Autonomous Driving

要約

多様で複雑なトレーニングシナリオの自動生成は、多くの複雑な学習タスクにおいて重要な要素となっています。
特に、自律運転などの実際のアプリケーションドメインでは、自動カリキュラムの生成は、堅牢で一般的なポリシーを取得するために不可欠であると考えられています。
ただし、複数の不均一なエージェントを使用してトラフィックシナリオを作成することは、通常、特により複雑なシミュレーション環境で、退屈で時間のかかるタスクと見なされます。
私たちの仕事では、マルチエージェントトラフィックシナリオフレームワークであるMATS-GYMを紹介します。
MATS-GYMは、部分的なシナリオ仕様を使用して、さまざまな数のエージェントを含むトラフィックシナリオを生成する自律運転のためのマルチエージェントトレーニングフレームワークです。
このホワイトペーパーでは、トラフィックシナリオの説明に対するさまざまな既存のアプローチの説明を単一のトレーニングフレームワークに統合し、監視されていない環境設計から適応性のある自動カリキュラムの生成を自動化するための技術とどのように統合できるかを示します。
このコードは、https://github.com/autonomousdrivingexaminer/mats-gymで入手できます。

要約(オリジナル)

The automated generation of diverse and complex training scenarios has been an important ingredient in many complex learning tasks. Especially in real-world application domains, such as autonomous driving, auto-curriculum generation is considered vital for obtaining robust and general policies. However, crafting traffic scenarios with multiple, heterogeneous agents is typically considered as a tedious and time-consuming task, especially in more complex simulation environments. In our work, we introduce MATS-Gym, a Multi-Agent Traffic Scenario framework to train agents in CARLA, a high-fidelity driving simulator. MATS-Gym is a multi-agent training framework for autonomous driving that uses partial scenario specifications to generate traffic scenarios with variable numbers of agents. This paper unifies various existing approaches to traffic scenario description into a single training framework and demonstrates how it can be integrated with techniques from unsupervised environment design to automate the generation of adaptive auto-curricula. The code is available at https://github.com/AutonomousDrivingExaminer/mats-gym.

arxiv情報

著者 Axel Brunnbauer,Luigi Berducci,Peter Priller,Dejan Nickovic,Radu Grosu
発行日 2025-02-06 14:28:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO | Scenario-Based Curriculum Generation for Multi-Agent Autonomous Driving はコメントを受け付けていません

Towards UAV-USV Collaboration in Harsh Maritime Conditions Including Large Waves

要約

このペーパーでは、大きな波を特徴とする厳しい海事条件で、無人航空機(UAV)と無人水上車両(USV)の間の緊密なコラボレーションのために設計されたシステムを紹介します。
このオンボードUAVシステムは、このような困難な条件下でタスクをフォローおよび着陸させるために、USVとのコラボレーションを強化することを目的としています。
私たちのシステムの主な貢献は、新しい数学USVモデルであり、USV状態を推定および予測するために使用される波状の水面上の6度の自由度でのUSVの動きを説明しています。
推定器は、複数のグローバルおよびオンボードセンサーからデータを融合し、正確なUSV状態の推定を確保します。
予測子は、新しい数学的USVモデルと最後の推定状態を使用して、将来のUSV状態を計算します。
推定および予測されたUSV状態は、厳しい環境条件であっても、USVまたはそのデッキに着陸するためのUAV軌道を生成する軌跡プランナーに転送されます。
提案されたアプローチは、多数のシミュレーションで検証され、現実の世界に展開されました。そこでは、UAVがUSVに従い、デッキに繰り返し着陸することができました。

要約(オリジナル)

This paper introduces a system designed for tight collaboration between Unmanned Aerial Vehicles (UAVs) and Unmanned Surface Vehicles (USVs) in harsh maritime conditions characterized by large waves. This onboard UAV system aims to enhance collaboration with USVs for following and landing tasks under such challenging conditions. The main contribution of our system is the novel mathematical USV model, describing the movement of the USV in 6 degrees of freedom on a wavy water surface, which is used to estimate and predict USV states. The estimator fuses data from multiple global and onboard sensors, ensuring accurate USV state estimation. The predictor computes future USV states using the novel mathematical USV model and the last estimated states. The estimated and predicted USV states are forwarded into a trajectory planner that generates a UAV trajectory for following the USV or landing on its deck, even in harsh environmental conditions. The proposed approach was verified in numerous simulations and deployed to the real world, where the UAV was able to follow the USV and land on its deck repeatedly.

arxiv情報

著者 Filip Novák,Tomáš Báča,Ondřej Procházka,Martin Saska
発行日 2025-02-06 15:36:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Towards UAV-USV Collaboration in Harsh Maritime Conditions Including Large Waves はコメントを受け付けていません

Collaborative Object Manipulation on the Water Surface by a UAV-USV Team Using Tethers

要約

このホワイトペーパーでは、無人航空機(UAV)とTethersによってオブジェクトに接続された無人の表面車両(USV)のコラボレーションを通じて、水面上のオブジェクト操作のための革新的な方法論を紹介します。
UAV、USV、およびテザーフローティングオブジェクトを組み合わせたロボットシステムの新しい数学モデルを提案します。
新しいモデル予測制御(MPC)フレームワークは、このモデルを使用して、この共同ロボットシステムの正確な制御とガイダンスを実現するために設計されています。
Extensive simulations in the realistic robotic simulator Gazebo demonstrate the system’s readiness for real-world deployment, highlighting its versatility and effectiveness.
Our multi-robot system overcomes the state-of-the-art single-robot approach, exhibiting smaller control errors during the tracking of the floating object’s reference.
さらに、マルチロボットシステムは、シングルロボットアプローチと比較して、外乱からの回復時間の短縮を示しています。

要約(オリジナル)

This paper introduces an innovative methodology for object manipulation on the surface of water through the collaboration of an Unmanned Aerial Vehicle (UAV) and an Unmanned Surface Vehicle (USV) connected to the object by tethers. We propose a novel mathematical model of a robotic system that combines the UAV, USV, and the tethered floating object. A novel Model Predictive Control (MPC) framework is designed for using this model to achieve precise control and guidance for this collaborative robotic system. Extensive simulations in the realistic robotic simulator Gazebo demonstrate the system’s readiness for real-world deployment, highlighting its versatility and effectiveness. Our multi-robot system overcomes the state-of-the-art single-robot approach, exhibiting smaller control errors during the tracking of the floating object’s reference. Additionally, our multi-robot system demonstrates a shorter recovery time from a disturbance compared to the single-robot approach.

arxiv情報

著者 Filip Novák,Tomáš Báča,Martin Saska
発行日 2025-02-06 15:39:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Collaborative Object Manipulation on the Water Surface by a UAV-USV Team Using Tethers はコメントを受け付けていません

Robotic Exploration using Generalized Behavioral Entropy

要約

この作業は、不確実性の知覚の人間モデルを活用するロボット探査のための新しい戦略を提示し、評価します。
これを行うために、「行動エントロピー」と呼ばれる不確実性の尺度を紹介します。これは、Precelecの行動経済学からの確率の重みに基づいています。
新しい演算子は許容可能な一般化エントロピーであることを示し、その理論的特性を分析し、それをシャノンやレンジなどの他の一般的な定式化と比較します。
特に、ここで導入された不確実性に対する感度と知覚性の測定の意味で、新しい定式化がどのように表現力があるかについて説明します。
次に、行動のエントロピーを使用して、フロンティアベースの環境探査プロセスを導くことができる新しいタイプのユーティリティ関数を定義します。
アプローチの利点は、ClearPath Warthogロボットを使用して、概念実証およびROSユニティシミュレーション環境で説明され、比較されます。
行動エントロピーを装備したロボットが、シャノンやレンイのエントロピーよりも速く探索することを示しています。

要約(オリジナル)

This work presents and evaluates a novel strategy for robotic exploration that leverages human models of uncertainty perception. To do this, we introduce a measure of uncertainty that we term ‘Behavioral entropy’, which builds on Prelec’s probability weighting from Behavioral Economics. We show that the new operator is an admissible generalized entropy, analyze its theoretical properties and compare it with other common formulations such as Shannon’s and Renyi’s. In particular, we discuss how the new formulation is more expressive in the sense of measures of sensitivity and perceptiveness to uncertainty introduced here. Then we use Behavioral entropy to define a new type of utility function that can guide a frontier-based environment exploration process. The approach’s benefits are illustrated and compared in a Proof-of-Concept and ROS-Unity simulation environment with a Clearpath Warthog robot. We show that the robot equipped with Behavioral entropy explores faster than Shannon and Renyi entropies.

arxiv情報

著者 Aamodh Suresh,Carlos Nieto-Granda,Sonia Martinez
発行日 2025-02-06 15:48:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.RO, math.IT | Robotic Exploration using Generalized Behavioral Entropy はコメントを受け付けていません

Making Sense of Touch: Unsupervised Shapelet Learning in Bag-of-words Sense

要約

このホワイトペーパーでは、長い時系列データをShapeletメンバーシップの確率にマッピングすることにより、入力寸法を減らすために、T分配確率的隣接埋め込み(T-SNE)を隠された層として使用するニューラルネットワークであるNN-STNEを紹介します。
ガウスカーネルベースの平均平方根誤差はローカルデータ構造を保持しますが、K-meansは非凸最適化チャレンジのためにシェイペレット候補を初期化します。
既存の方法とは異なり、私たちのアプローチはT-SNEを使用して低次元空間の混雑に対処し、L1-NORMの正規化を適用して、シェープレットの長さを最適化します。
UCRデータセットと電気コンポーネント操作タスクの評価は、オンにするなど、ロボット工学の最先端の機能学習方法よりもクラスタリングの精度の向上を示しています。

要約(オリジナル)

This paper introduces NN-STNE, a neural network using t-distributed stochastic neighbor embedding (t-SNE) as a hidden layer to reduce input dimensions by mapping long time-series data into shapelet membership probabilities. A Gaussian kernel-based mean square error preserves local data structure, while K-means initializes shapelet candidates due to the non-convex optimization challenge. Unlike existing methods, our approach uses t-SNE to address crowding in low-dimensional space and applies L1-norm regularization to optimize shapelet length. Evaluations on the UCR dataset and an electrical component manipulation task, like switching on, demonstrate improved clustering accuracy over state-of-the-art feature-learning methods in robotics.

arxiv情報

著者 Zhicong Xian,Tabish Chaudhary,Jürgen Bock
発行日 2025-02-06 15:50:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Making Sense of Touch: Unsupervised Shapelet Learning in Bag-of-words Sense はコメントを受け付けていません

From Configuration-Space Clearance to Feature-Space Margin: Sample Complexity in Learning-Based Collision Detection

要約

モーション計画はロボット工学の中心的な課題であり、学習ベースのアプローチは近年大きな注目を集めています。
私たちの作業は、これらのアプローチの特定の側面に焦点を当てています。マシンラーニング手法、特にベクターマシン(SVM)をサポートするために、ロボット構成が衝突フリーであるかどうかを評価し、「衝突検出」と呼ばれる操作です。
これらの方法の人気が高まっているにもかかわらず、効率と予測の精度をサポートする理論の欠如があります。
これは、一般的な機械学習方法、特にSVMの豊富な理論的結果とはまったく対照的です。
私たちの作業は、モーション計画における学習ベースの衝突検出のためのSVM分類器のサンプルの複雑さを分析することにより、このギャップを橋渡しします。
特定の信頼レベルで指定された精度を達成するために必要なサンプルの数を拘束しました。
この結果は、システムのクリアランスなどのロボットモーションプランニングに関連する用語で述べられています。
これらの理論的結果に基づいて、ロボット構成を衝突のないものとして分類する際のアルゴリズムのエラーについて統計的保証を提供できる衝突検出アルゴリズムを提案します。

要約(オリジナル)

Motion planning is a central challenge in robotics, with learning-based approaches gaining significant attention in recent years. Our work focuses on a specific aspect of these approaches: using machine-learning techniques, particularly Support Vector Machines (SVM), to evaluate whether robot configurations are collision free, an operation termed “collision detection”. Despite the growing popularity of these methods, there is a lack of theory supporting their efficiency and prediction accuracy. This is in stark contrast to the rich theoretical results of machine-learning methods in general and of SVMs in particular. Our work bridges this gap by analyzing the sample complexity of an SVM classifier for learning-based collision detection in motion planning. We bound the number of samples needed to achieve a specified accuracy at a given confidence level. This result is stated in terms relevant to robot motion-planning such as the system’s clearance. Building on these theoretical results, we propose a collision-detection algorithm that can also provide statistical guarantees on the algorithm’s error in classifying robot configurations as collision-free or not.

arxiv情報

著者 Sapir Tubul,Aviv Tamar,Kiril Solovey,Oren Salzman
発行日 2025-02-06 15:58:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | From Configuration-Space Clearance to Feature-Space Margin: Sample Complexity in Learning-Based Collision Detection はコメントを受け付けていません

Dense Fixed-Wing Swarming using Receding-Horizon NMPC

要約

この論文では、アジャイルな固定翼航空車両のチームを互いに近くに制御するためのアプローチを紹介します。
私たちのアプローチは、拡張された飛行エンベロープ全体で操作を計画してエージェント間の衝突回避を可能にするために、繰り返し星の非線形モデル予測制御(NMPC)に依存しています。
堅牢な衝突回避を促進し、エージェント間衝突の可能性を特徴付けるために、システムが計画された公称軌跡の周りにチューブを残す可能性について統計的に結合します。
最後に、非常に動的な群れを評価するためのメトリックを提案し、このメトリックを使用してアプローチを評価します。
シミュレーションとハードウェアの両方の実験を通じてアプローチを成功裏に実証しました。知る限り、これは、物理的なエロバチンの固定翼車両で初めて群れが達成されました。

要約(オリジナル)

In this paper, we present an approach for controlling a team of agile fixed-wing aerial vehicles in close proximity to one another. Our approach relies on receding-horizon nonlinear model predictive control (NMPC) to plan maneuvers across an expanded flight envelope to enable inter-agent collision avoidance. To facilitate robust collision avoidance and characterize the likelihood of inter-agent collisions, we compute a statistical bound on the probability of the system leaving a tube around the planned nominal trajectory. Finally, we propose a metric for evaluating highly dynamic swarms and use this metric to evaluate our approach. We successfully demonstrated our approach through both simulation and hardware experiments, and to our knowledge, this the first time close-quarters swarming has been achieved with physical aerobatic fixed-wing vehicles.

arxiv情報

著者 Varun Madabushi,Yocheved Kopel,Adam Polevoy,Joseph Moore
発行日 2025-02-06 16:07:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Dense Fixed-Wing Swarming using Receding-Horizon NMPC はコメントを受け付けていません

Compliant Beaded-String Jamming For Variable Stiffness Anthropomorphic Fingers

要約

ロボットグリッパーで人間のような器用さを達成することは、特に不確実な環境での堅牢な操作を確保する上で、依然としてオープンな挑戦です。
ソフトロボットの手は、パッシブコンプライアンスを活用することにより、これに対処しようとします。これは、人間の手の適応性にとって重要な特性であり、高解像度のセンシングと複雑な制御への依存を減らしながら、より堅牢な操作を達成します。
操作タスクにおける精度と姿勢の安定性の観点からのさらなる改善は、可変剛性メカニズムの統合を通じて達成されますが、これらは残留コンプライアンスを欠く傾向があり、かさばり、応答時間が遅くなります。
これらの制限に対処するために、この作業は、パッシブな残留コンプライアンスと調整可能な剛性を示す擬人化指の指の準拠した関節詰まりメカニズムを導入し、人間の第十頭の関節のそれに沿った動きの範囲を達成します。
メカニズムによって提供される剛性範囲は、0.48 nm/radから1.95 nm/rad(4倍の増加)に制御可能です。
再現性、ヒステリシス、剛性も、妨害力の関数として特徴付けられました。
提案されたシステムによって得られる受動的な残留コンプライアンスの重要性を実証するために、硬いものと比較した場合、共同設計を統合するグリッパーの成功率は60%高いことを示しました。

要約(オリジナル)

Achieving human-like dexterity in robotic grippers remains an open challenge, particularly in ensuring robust manipulation in uncertain environments. Soft robotic hands try to address this by leveraging passive compliance, a characteristic that is crucial to the adaptability of the human hand, to achieve more robust manipulation while reducing reliance on high-resolution sensing and complex control. Further improvements in terms of precision and postural stability in manipulation tasks are achieved through the integration of variable stiffness mechanisms, but these tend to lack residual compliance, be bulky and have slow response times. To address these limitations, this work introduces a Compliant Joint Jamming mechanism for anthropomorphic fingers that exhibits passive residual compliance and adjustable stiffness, while achieving a range of motion in line with that of human interphalangeal joints. The stiffness range provided by the mechanism is controllable from 0.48 Nm/rad to 1.95 Nm/rad (a 4x increase). Repeatability, hysteresis and stiffness were also characterized as a function of the jamming force. To demonstrate the importance of the passive residual compliance afforded by the proposed system, a peg-in-hole task was conducted, which showed a 60% higher success rate for a gripper integrating our joint design when compared to a rigid one.

arxiv情報

著者 Maximilian Westermann,Marco Pontin,Leone Costi,Alessandro Albini,Perla Maiolino
発行日 2025-02-06 16:25:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Compliant Beaded-String Jamming For Variable Stiffness Anthropomorphic Fingers はコメントを受け付けていません

Graph machine learning for flight delay prediction due to holding manouver

要約

操縦を保持するための飛行遅延は、航空の批判的で費用のかかる現象であり、航空交通渋滞を管理し、安全を確保する必要性に駆り立てられます。
多くの場合、空港の混雑、悪天候、航空交通管制の制限などの要因が原因で、航空機が指定された空域で円を描くように指示されるように指示されたときに操作が発生します。
この研究では、マニューバーをグラフの問題として保持するための飛行遅延の予測をモデル化し、高度なグラフ機械学習(グラフML)技術を活用して、航空交通ネットワークの複雑な相互依存関係をキャプチャします。
安全に不可欠なものの、操縦を保持すると、燃料の使用量、排出量、乗客の不満が増加し、運用効率に正確な予測が不可欠になります。
通常、表形式データを使用する従来の機械学習モデルは、多くの場合、航空交通データ内の空間的関係を見落としています。
これに対処するために、ネットワークの中心性と接続性をキャプチャしたグラフ機能が濃縮されたCatBoostの両方を適用する方向(マルチ)グラフのエッジフィーチャの予測として保持を予測する問題をモデル化します。
データコンテキスト。
私たちの結果は、CatBoostがこの不均衡なデータセットのGATを上回ることを示しており、グラフベースの機能の重要性を通じて、イベントを保持するイベントを効果的に予測し、解釈可能性を提供します。
さらに、ユーザーがリアルタイムの遅延予測をシミュレートできるようにするWebベースのツールを介して、モデルの潜在的な運用上の影響について説明します。
この研究では、燃料効率の向上、遅延の削減、乗客体験の改善に影響を与えることに、航空における予測分析のためのグラフベースのアプローチの実行可能性を強調しています。

要約(オリジナル)

Flight delays due to holding maneuvers are a critical and costly phenomenon in aviation, driven by the need to manage air traffic congestion and ensure safety. Holding maneuvers occur when aircraft are instructed to circle in designated airspace, often due to factors such as airport congestion, adverse weather, or air traffic control restrictions. This study models the prediction of flight delays due to holding maneuvers as a graph problem, leveraging advanced Graph Machine Learning (Graph ML) techniques to capture complex interdependencies in air traffic networks. Holding maneuvers, while crucial for safety, cause increased fuel usage, emissions, and passenger dissatisfaction, making accurate prediction essential for operational efficiency. Traditional machine learning models, typically using tabular data, often overlook spatial-temporal relations within air traffic data. To address this, we model the problem of predicting holding as edge feature prediction in a directed (multi)graph where we apply both CatBoost, enriched with graph features capturing network centrality and connectivity, and Graph Attention Networks (GATs), which excel in relational data contexts. Our results indicate that CatBoost outperforms GAT in this imbalanced dataset, effectively predicting holding events and offering interpretability through graph-based feature importance. Additionally, we discuss the model’s potential operational impact through a web-based tool that allows users to simulate real-time delay predictions. This research underscores the viability of graph-based approaches for predictive analysis in aviation, with implications for enhancing fuel efficiency, reducing delays, and improving passenger experience.

arxiv情報

著者 Jorge L. Franco,Manoel V. Machado Neto,Filipe A. N. Verri,Diego R. Amancio
発行日 2025-02-06 17:18:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI | Graph machine learning for flight delay prediction due to holding manouver はコメントを受け付けていません

Causal Learning for Heterogeneous Subgroups Based on Nonlinear Causal Kernel Clustering

要約

多様な環境から収集されたマルチソースと不均一なデータによってもたらされる課題により、機能間の因果関係は、異なる時間スパン、領域、または戦略の影響を受けるバリエーションを示す可能性があります。
この多様性により、すべての観察データにおける複雑な因果関係を正確に表すには、単一の因果モデルが不十分になります。これは、因果学習における重要な考慮事項です。
この課題に対処するために、不均一なサブグループ因果学習のために非線形因果カーネルクラスタリング法が導入され、多様なサブグループ間の因果関係の変動を強調します。
\ textColor {new} {クラスタリング不均一なサブグループのメインコンポーネントは、さまざまなサンプルの潜在的な非線形因果関係の違いを評価し、因果関係によってサポートされている潜在的な非線形因果関係の違いを評価する、$ u $ centeredサンプルマッピング関数の構築にあります。
識別可能性理論。}実験結果は、この方法が不均一なサブグループを識別し、因果学習を強化し、予測エラーの減少につながることを示しています。

要約(オリジナル)

Due to the challenge posed by multi-source and heterogeneous data collected from diverse environments, causal relationships among features can exhibit variations influenced by different time spans, regions, or strategies. This diversity makes a single causal model inadequate for accurately representing complex causal relationships in all observational data, a crucial consideration in causal learning. To address this challenge, the nonlinear Causal Kernel Clustering method is introduced for heterogeneous subgroup causal learning, highlighting variations in causal relationships across diverse subgroups. \textcolor{new}{The main component for clustering heterogeneous subgroups lies in the construction of the $u$-centered sample mapping function with the property of unbiased estimation, which assesses the differences in potential nonlinear causal relationships in various samples and supported by causal identifiability theory.} Experimental results indicate that the method performs well in identifying heterogeneous subgroups and enhancing causal learning, leading to a reduction in prediction error.

arxiv情報

著者 Lu Liu,Yang Tang,Kexuan Zhang,Qiyu Sun
発行日 2025-02-06 17:24:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Causal Learning for Heterogeneous Subgroups Based on Nonlinear Causal Kernel Clustering はコメントを受け付けていません