Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles

要約

近年、自律走行車(Autonomous Vehicle: AV)が注目を集めており、強化学習(Reinforcement Learning: RL)は自動車の自律性を向上させる上で目覚ましい性能を示している。この点、広く採用されているモデルフリーRL(MFRL)は、学習用のデータサンプルが大量に用意されていることを条件として、コネクテッドAV(CAV)における意思決定タスクの解決を約束する。とはいえ、実際には実現不可能で、学習が不安定になる可能性があります。対照的に、モデルベースRL(MBRL)はサンプル効率の良い学習を実現するが、MBRLの漸近的性能は最先端のMFRLアルゴリズムに遅れをとる可能性がある。さらに、CAVを対象とした研究の多くは、単一のAVの意思決定のみに限定されているため、通信がないことによる性能の低下が強調されている。本研究では、通信手段が限られた複数のCAVの意思決定問題に取り組み、分散型マルチエージェント確率的アンサンブル(Multi-Agent Probabilistic Ensembles with Trajectory Sampling)アルゴリズムMA-PETSを提案する。特に、未知の環境の不確実性をより良く捉えるために、MA-PETSは確率的アンサンブル(PE)ニューラルネットワークを活用し、近隣のCAV間の通信サンプルから学習する。その後、MA-PETSは軌道サンプリング(Trajectory Sampling: TS)に基づくモデル予測制御を開発し、意思決定を行う。これに基づき、通信範囲内のエージェント数に影響されるマルチエージェントグループ後悔限界を導出し、エージェント間の効果的な情報交換をマルチエージェント学習スキームに組み込むことで、最悪の場合、グループ後悔限界の低減に寄与することを数学的に検証する。最後に、MFBLに匹敵するサンプル効率という点で、MA-PETSの優位性を実証的に示す。

要約(オリジナル)

Autonomous Vehicles (AVs) have attracted significant attention in recent years and Reinforcement Learning (RL) has shown remarkable performance in improving the autonomy of vehicles. In that regard, the widely adopted Model-Free RL (MFRL) promises to solve decision-making tasks in connected AVs (CAVs), contingent on the readiness of a significant amount of data samples for training. Nevertheless, it might be infeasible in practice and possibly lead to learning instability. In contrast, Model-Based RL (MBRL) manifests itself in sample-efficient learning, but the asymptotic performance of MBRL might lag behind the state-of-the-art MFRL algorithms. Furthermore, most studies for CAVs are limited to the decision-making of a single AV only, thus underscoring the performance due to the absence of communications. In this study, we try to address the decision-making problem of multiple CAVs with limited communications and propose a decentralized Multi-Agent Probabilistic Ensembles with Trajectory Sampling algorithm MA-PETS. In particular, in order to better capture the uncertainty of the unknown environment, MA-PETS leverages Probabilistic Ensemble (PE) neural networks to learn from communicated samples among neighboring CAVs. Afterwards, MA-PETS capably develops Trajectory Sampling (TS)-based model-predictive control for decision-making. On this basis, we derive the multi-agent group regret bound affected by the number of agents within the communication range and mathematically validate that incorporating effective information exchange among agents into the multi-agent learning scheme contributes to reducing the group regret bound in the worst case. Finally, we empirically demonstrate the superiority of MA-PETS in terms of the sample efficiency comparable to MFBL.

arxiv情報

著者 Ruoqi Wen,Jiahao Huang,Rongpeng Li,Guoru Ding,Zhifeng Zhao
発行日 2024-07-03 08:54:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.MA, cs.RO | コメントする

Online Time-Informed Kinodynamic Motion Planning of Nonlinear Systems

要約

サンプリングベース・キノダイナミック・モーション・プランナー(SKMP)は、微分制約下の高次元システムに対して、衝突のない軌道を求める際に威力を発揮する。時間情報集合(TIS)は、時間最適解への収束を加速するための発見的探索領域を提供することができる。しかし、既存のTIS近似法は、次元の呪い、計算負荷、および線形系や多項式非線形系などシステムの適用範囲の狭さに悩まされている。これらの問題を克服するために、我々はディープラーニング技術、クープマン作用素理論、ランダム集合理論を活用した手法を提案する。具体的には、DIKUと名付けられた制御Uモデルを持つディープインバーティブルクープマン演算子を提案し、補助ネットワークをインバーティブルニューラルネットワークに変更することで、長いホライズンにおける状態の前後予測を行う。非線形制御系のTISをオンラインで近似するために、DIKUの到達可能性解析を行うサンプリングベースのアプローチASKUを開発した。さらに、TISにおいて一様なランダムサンプルを抽出するための直接サンプリング技術を用いたオンライン時間情報SKMPを設計する。シミュレーション実験の結果、本手法が他の既存手法を凌駕し、ほぼリアルタイムでTISを近似し、いくつかの時間最適キノダイナミック運動計画問題において優れた計画性能を達成することが実証された。

要約(オリジナル)

Sampling-based kinodynamic motion planners (SKMPs) are powerful in finding collision-free trajectories for high-dimensional systems under differential constraints. Time-informed set (TIS) can provide the heuristic search domain to accelerate their convergence to the time-optimal solution. However, existing TIS approximation methods suffer from the curse of dimensionality, computational burden, and limited system applicable scope, e.g., linear and polynomial nonlinear systems. To overcome these problems, we propose a method by leveraging deep learning technology, Koopman operator theory, and random set theory. Specifically, we propose a Deep Invertible Koopman operator with control U model named DIKU to predict states forward and backward over a long horizon by modifying the auxiliary network with an invertible neural network. A sampling-based approach, ASKU, performing reachability analysis for the DIKU is developed to approximate the TIS of nonlinear control systems online. Furthermore, we design an online time-informed SKMP using a direct sampling technique to draw uniform random samples in the TIS. Simulation experiment results demonstrate that our method outperforms other existing works, approximating TIS in near real-time and achieving superior planning performance in several time-optimal kinodynamic motion planning problems.

arxiv情報

著者 Fei Meng,Jianbang Liu,Haojie Shi,Han Ma,Hongliang Ren,Max Q. -H. Meng
発行日 2024-07-03 09:05:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | コメントする

Past, Present, and Future: A Survey of The Evolution of Affective Robotics For Well-being

要約

近年、人間の幸福をサポートするロボットの可能性が注目されています。急速に発展する感情表現技術や人工知能技術により、この研究分野は近年爆発的に拡大・発展している。本論文では、近年の研究動向をより深く理解するために、ウェルビーイングのための感情ロボットに関する過去10年間の研究を系統的にレビューする。このレビューでは、研究されてきたウェルビーイングの領域、ウェルビーイングのための感情ロボットを調査するために使用された方法、そしてそれらが時間とともにどのように進化してきたかを明らかにする。また、技術的、デザイン的、倫理的という3つの観点から、この多面的な研究テーマの進化を検証する。最後に、我々のレビューで明らかになったギャップをもとに、今後の研究の可能性について議論する。我々のレビューの結果は、人間とロボットの相互作用や感情コンピューティングの研究者だけでなく、臨床医や福祉専門家にとっても興味深いものである。

要約(オリジナル)

Recent research in affective robots has recognized their potential in supporting human well-being. Due to rapidly developing affective and artificial intelligence technologies, this field of research has undergone explosive expansion and advancement in recent years. In order to develop a deeper understanding of recent advancements, we present a systematic review of the past 10 years of research in affective robotics for wellbeing. In this review, we identify the domains of well-being that have been studied, the methods used to investigate affective robots for well-being, and how these have evolved over time. We also examine the evolution of the multifaceted research topic from three lenses: technical, design, and ethical. Finally, we discuss future opportunities for research based on the gaps we have identified in our review — proposing pathways to take affective robotics from the past and present to the future. The results of our review are of interest to human-robot interaction and affective computing researchers, as well as clinicians and well-being professionals who may wish to examine and incorporate affective robotics in their practices.

arxiv情報

著者 Micol Spitale,Minja Axelsson,Sooyeon Jeong,Paige Tuttosı,Caitlin A. Stamatis,Guy Laban,Angelica Lim,Hatice Gune
発行日 2024-07-03 09:49:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | コメントする

Development of a semi-autonomous framework for NDT inspection with a tilting aerial platform

要約

本レターでは、5自由度のロボットアームを備えた全方位傾斜ドローンで構成される空中マニピュレータの制御問題について検討する。このロボットは、構造物の検査や非破壊測定を行うために、環境と相互作用する必要がある。パラレルフォースインピーダンス制御技術が開発され、設計された表面と所望のフォースプロファイルで接触する。相互作用の間、表面とエンドエフェクタに取り付けられたエコーセンサとの間に真空状態を作り出し、相互作用表面の厚さを測定するための押し出しフェーズが必要となる。アルゴリズムの再現性を示すために、繰り返し測定が行われる。

要約(オリジナル)

This letter investigates the problem of controlling an aerial manipulator, composed of an omnidirectional tilting drone equipped with a five-degrees-of-freedom robotic arm. The robot has to interact with the environment to inspect structures and perform non-destructive measurements. A parallel force-impedance control technique is developed to establish contact with the designed surface with a desired force profile. During the interaction, a pushing phase is required to create a vacuum between the surface and the echometer sensor mounted at the end-effector, to measure the thickness of the interaction surface. Repetitive measures are performed to show the repeatability of the algorithm.

arxiv情報

著者 Salvatore Marcellini,Simone D’Angelo,Alessandro De Crescenzo,Michele Marolla,Vincenzo Lippiello,Bruno Siciliano
発行日 2024-07-03 11:01:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

NLP Sampling: Combining MCMC and NLP Methods for Diverse Constrained Sampling

要約

困難な制約条件下で多様なサンプルを生成することは、多くの分野における中心的な課題である。本研究では、MCMC、制約条件付き最適化、ロボット工学の各分野の手法を統合する視点と枠組みを提供し、経験的評価からその長所を洞察することを目的とする。我々は、一般的な問題定式化としてNLPサンプリングを提案し、各分野の手法を統合する枠組みとして再スタート二相法ファミリーを提案し、解析的問題とロボット操作計画問題でそれらを評価する。また、ラグランジュパラメータの役割、グローバルサンプリング、拡散NLPのアイデア、モデルベースのノイズ除去サンプラーなど、概念的な議論も行う。

要約(オリジナル)

Generating diverse samples under hard constraints is a core challenge in many areas. With this work we aim to provide an integrative view and framework to combine methods from the fields of MCMC, constrained optimization, as well as robotics, and gain insights in their strengths from empirical evaluations. We propose NLP Sampling as a general problem formulation, propose a family of restarting two-phase methods as a framework to integrated methods from across the fields, and evaluate them on analytical and robotic manipulation planning problems. Complementary to this, we provide several conceptual discussions, e.g. on the role of Lagrange parameters, global sampling, and the idea of a Diffused NLP and a corresponding model-based denoising sampler.

arxiv情報

著者 Marc Toussaint,Cornelius V. Braun,Joaquim Ortiz-Haro
発行日 2024-07-03 11:55:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO | コメントする

Position and Altitude of the Nao Camera Head from Two Points on the Soccer Field plus the Gravitational Direction

要約

サッカーをプレーするためには、ロボットがフィールド上の現在位置を正しく推定する必要がある。理想的には、位置がわかっている複数の特徴が見えることである。三角法を応用することで、この観察が実際に行われた視点を推定することができる。スタンダード・プラットフォーム・リーグのNaoロボットの視野は非常に限られているため、1つのカメラフレームで認識できる点は通常1つか2つである。 本論文では、単純化された四面体の形状から、フィールド上の(x, y)座標とカメラの高さhを決定する方法を提案する。この構成は、地上面上の2つの観測点に重力方向を加えたものである。2点間の距離が既知であり、点への方向と重力方向が測定されれば、四面体のすべての寸法を決定することができる。 古典的な三角法の代わりに有理三角法を用いてこれらの計算を行うことで、同等の数値精度で28.7%計算が速くなることが判明した。また、オプティトラック・システムにより、奈緒の頭部の位置を外部から測定することもできる。外部から測定した位置とセンサーデータから内部で予測した位置の差から、ゴールポストの外縁の消失点から重力方向を推定した場合、平均絶対誤差は3~6cmの範囲となった。

要約(オリジナル)

To be able to play soccer, a robot needs a good estimate of its current position on the field. Ideally, multiple features are visible that have known locations. By applying trigonometry we can estimate the viewpoint from where this observation was actually made. Given that the Nao robots of the Standard Platform League have quite a limited field of view, a given camera frame typically only allows for one or two points to be recognized. In this paper we propose a method for determining the (x, y) coordinates on the field and the height h of the camera from the geometry of a simplified tetrahedron. This configuration is formed by two observed points on the ground plane plus the gravitational direction. When the distance between the two points is known, and the directions to the points plus the gravitational direction are measured, all dimensions of the tetrahedron can be determined. By performing these calculations with rational trigonometry instead of classical trigonometry, the computations turn out to be 28.7% faster, with equal numerical accuracy. The position of the head of the Nao can also be externally measured with the OptiTrack system. The difference between externally measured and internally predicted position from sensor data gives us mean absolute errors in the 3-6 centimeters range, when we estimated the gravitational direction from the vanishing point of the outer edges of the goal posts.

arxiv情報

著者 Stijn Oomes,Arnoud Visser
発行日 2024-07-03 12:06:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68, cs.CV, cs.RO, I.4.8 | コメントする

Using Buckingham’s $π$ Theorem for Multi-System Learning Transfer: a Case-study with 3 Vehicles Sharing a Database

要約

多くの先進運転支援スキームや自律走行車コントローラは、車両挙動の運動モデル、すなわち与えられた制御入力に対して車両がどのように反応するかを予測する関数に基づいている。実験データやシミュレーションデータに基づくデータ駆動型モデルは、特に解析的にモデル化することが困難な車両、例えば地面とタイヤの相互作用を第一原理からモデル化することが困難な地上車両にとって非常に有用である。しかし、学習スキームは、大量の実験データを収集することが困難であったり、高忠実度のシミュレーションに頼らざるを得ないという制約がある。本論文では、バッキンガムの$pi$定理に基づく無次元数を用いて、モデル学習のためのデータ効率を改善するアプローチの可能性を探求し、類似システム間の知識共有を促進することを目的とする。自動車のような車両を用いたケーススタディにより、従来のモデルと無次元モデルをシミュレーションデータと実験データで比較し、新しい無次元学習アプローチの利点を検証する。共有データベースを使用した場合の無次元スキームによる予測精度の向上、すなわち、様々な異なる車両からのデータに基づいて車両の運動を予測した場合、シミュレーションデータに基づいて単純なノースリップ操縦を予測した場合は480%、実験データに基づいて高度に動的なブレーキ操縦を予測した場合は11%精度が向上することが分かった。また、手作業で作成された無次元特徴を持つ修正された物理情報学習スキームにより、それぞれ917%と28%の精度向上が示された。比較研究により、バッキンガムの$pi$定理を用いることが、主成分分析(PCA)や単にデータを正規化するよりも、この課題に対してはるかに効果的な前処理ステップであることも示された。

要約(オリジナル)

Many advanced driver assistance schemes or autonomous vehicle controllers are based on a motion model of the vehicle behavior, i.e., a function predicting how the vehicle will react to a given control input. Data-driven models, based on experimental or simulated data, are very useful, especially for vehicles difficult to model analytically, for instance, ground vehicles for which the ground-tire interaction is hard to model from first principles. However, learning schemes are limited by the difficulty of collecting large amounts of experimental data or having to rely on high-fidelity simulations. This paper explores the potential of an approach that uses dimensionless numbers based on Buckingham’s $\pi$ theorem to improve the efficiency of data for learning models, with the goal of facilitating knowledge sharing between similar systems. A case study using car-like vehicles compares traditional and dimensionless models on simulated and experimental data to validate the benefits of the new dimensionless learning approach. Prediction accuracy improvements with the dimensionless scheme when using a shared database, that is, predicting the motion of a vehicle based on data from various different vehicles was found to be 480\% more accurate for predicting a simple no-slip maneuver based on simulated data and 11\% more accurate to predict a highly dynamic braking maneuver based on experimental data. A modified physics-informed learning scheme with hand-crafted dimensionless features was also shown to increase the improvement to precision gains of 917\% and 28\% respectively. A comparative study also shows that using Buckingham’s $\pi$ theorem is a much more effective preprocessing step for this task than principal component analysis (PCA) or simply normalizing the data.

arxiv情報

著者 William Therrien,Olivier Lecompte,Alexandre Girard
発行日 2024-07-03 13:05:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | コメントする

Applying Extended Object Tracking for Self-Localization of Roadside Radar Sensors

要約

高度道路交通システム(ITS)は、耐候性に優れ、検知距離が長く、製造コストが低いため、大規模な交通監視のために道路脇の4D mmWaveレーダー・センサの恩恵を受けることができる。しかし、外部測定装置を使用するローカライゼーション手法は、都市環境では限界があります。また、センサの取り付け位置が環境の影響により変化した場合、設置時のみの測定では補正することができない。本論文では、拡張物体追跡(Extended Object Tracking:EOT)を用いた路側レーダデータの自己位置特定を提案する。本手法は、センサで観測された車両の追跡軌跡と市街地の航空レーザスキャンの両方を分析し、軌跡区間と道路セグメントに「直進」、「左折」、「右折」などの運転行動のラベルを割り当て、点群を登録するために意味的反復最接近点(SICP)アルゴリズムを実行する。本手法は、ローカライゼーションのために、ダウンストリームタスクである物体追跡の結果を利用する。我々は、非常に低い方位誤差とともに、サブメートルレンジでの高い精度を実証する。また、この手法はデータ効率も良い。評価はシミュレーションと実環境テストの両方で行った。

要約(オリジナル)

Intelligent Transportation Systems (ITS) can benefit from roadside 4D mmWave radar sensors for large-scale traffic monitoring due to their weatherproof functionality, long sensing range and low manufacturing cost. However, the localization method using external measurement devices has limitations in urban environments. Furthermore, if the sensor mount exhibits changes due to environmental influences, they cannot be corrected when the measurement is performed only during the installation. In this paper, we propose self-localization of roadside radar data using Extended Object Tracking (EOT). The method analyses both the tracked trajectories of the vehicles observed by the sensor and the aerial laser scan of city streets, assigns labels of driving behaviors such as ‘straight ahead’, ‘left turn’, ‘right turn’ to trajectory sections and road segments, and performs Semantic Iterative Closest Points (SICP) algorithm to register the point cloud. The method exploits the result from a down stream task — object tracking — for localization. We demonstrate high accuracy in the sub-meter range along with very low orientation error. The method also shows good data efficiency. The evaluation is done in both simulation and real-world tests.

arxiv情報

著者 Longfei Han,Qiuyu Xu,Klaus Kefferpütz,Gordon Elger,Jürgen Beyerer
発行日 2024-07-03 13:06:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | コメントする

Performance Comparison of ROS2 Middlewares for Multi-robot Mesh Networks in Planetary Exploration

要約

最近のマルチロボットシステム(MRS)やメッシュネットワーク技術の進歩は、極限環境を探査する革新的なアプローチに道を開いている。一連の国際協定であるアルテミス協定は、最先端技術の利用を重視し、宇宙探査における協力を促進することで、この進歩をさらに促進した。これと並行して、様々な分野の企業がロボットオペレーティングシステム2(ROS 2)を広く採用していることは、その堅牢性と汎用性を裏付けている。本論文では、FastRTPS、CycloneDDS、Zenohなどの利用可能なROS 2 MiddleWare(RMW)の性能を、動的トポロジーを持つメッシュネットワーク上で評価する。RMWの最終的な選択は、MRSを用いた地球外極限環境の探査というシナリオに最も適合するものによって決定される。実環境での研究により、Zenohが将来的なアプリケーションのための潜在的なソリューションであることが浮き彫りになった。

要約(オリジナル)

Recent advancements in Multi-Robot Systems (MRS) and mesh network technologies pave the way for innovative approaches to explore extreme environments. The Artemis Accords, a series of international agreements, have further catalyzed this progress by fostering cooperation in space exploration, emphasizing the use of cutting-edge technologies. In parallel, the widespread adoption of the Robot Operating System 2 (ROS 2) by companies across various sectors underscores its robustness and versatility. This paper evaluates the performances of available ROS 2 MiddleWare (RMW), such as FastRTPS, CycloneDDS and Zenoh, over a mesh network with a dynamic topology. The final choice of RMW is determined by the one that would fit the most the scenario: an exploration of the extreme extra-terrestrial environment using a MRS. The conducted study in a real environment highlights Zenoh as a potential solution for future applications, showing a reduced delay, reachability, and CPU usage while being competitive on data overhead and RAM usage over a dynamic mesh topology

arxiv情報

著者 Loïck Pierre Chovet,Gabriel Manuel Garcia,Abhishek Bera,Antoine Richard,Kazuya Yoshida,Miguel Angel Olivares-Mendez
発行日 2024-07-03 13:30:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.NI, cs.RO | コメントする

IntentionNet: Map-Lite Visual Navigation at the Kilometre Scale

要約

この研究では、屋内外の環境を横断して遠くの目標に到達できる、スケーラブルでロバストなロボットナビゲーションシステムを構築するための課題を探求する。我々は、低レベルプランナ/コントローラとしてモノリシックニューラルネットワークを採用し、コントローラを操縦するために我々が意図と呼ぶ一般的なインターフェースを使用する、意図ネットと呼ばれるナビゲーションシステムアーキテクチャを提案する。本論文では、LPE(Local Path and Environment)とDLM(Discretised Local Move)の2種類の意図を提案し、DLMが測位誤差やマッピング誤差に対してロバストであることを示す。また、DLM意図を用いたIntentionNetシステムの一例であるKilo-IntentionNetをBoston Dynamics Spotロボットに搭載し、ノイズの多いオドメトリのみで、複雑な屋内外の環境を最大1kmまでナビゲートすることに成功した。

要約(オリジナル)

This work explores the challenges of creating a scalable and robust robot navigation system that can traverse both indoor and outdoor environments to reach distant goals. We propose a navigation system architecture called IntentionNet that employs a monolithic neural network as the low-level planner/controller, and uses a general interface that we call intentions to steer the controller. The paper proposes two types of intentions, Local Path and Environment (LPE) and Discretised Local Move (DLM), and shows that DLM is robust to significant metric positioning and mapping errors. The paper also presents Kilo-IntentionNet, an instance of the IntentionNet system using the DLM intention that is deployed on a Boston Dynamics Spot robot, and which successfully navigates through complex indoor and outdoor environments over distances of up to a kilometre with only noisy odometry.

arxiv情報

著者 Wei Gao,Bo Ai,Joel Loo,Vinay,David Hsu
発行日 2024-07-03 14:06:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | コメントする