HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning

要約

ビヘイビア ツリー (BT) は、そのモジュール性、反応性、堅牢性により、ロボット工学における制御構造としてますます人気が高まっています。
BT 生成方法に関しては、BT 計画は信頼性の高い BT を生成する可能性を示しています。
ただし、BT 計画のスケーラビリティは、主にドメイン知識の不足が原因で、複雑なシナリオでの計画時間が長くなることで制限されることがよくあります。
対照的に、事前トレーニングされた大規模言語モデル (LLM) は、さまざまなドメインにわたってタスク推論機能を実証していますが、その計画の正確さと安全性は依然として不確実です。
この論文では、BT 計画を LLM 推論と統合し、BT 生成のための信頼性が高く効率的なフレームワークであるヒューリスティック動作ツリー計画 (HBTP) を導入することを提案します。
HBTP の重要なアイデアは、タスク固有の推論に LLM を活用してヒューリスティック パスを生成し、BT 計画がそのパスに従って効率的に拡張できるようにすることです。
まず、ヒューリスティック BT 拡張プロセスと、それぞれ最適な計画と満足のいく計画のために設計された 2 つのヒューリスティック バリアントを紹介します。
次に、アクション空間の枝刈りや反射フィードバックなど、LLM 推論の不正確さに対処し、推論の精度と計画効率の両方をさらに向上させる方法を提案します。
実験では HBTP の理論的限界を実証し、4 つのデータセットの結果により、日常のサービス ロボット アプリケーションにおけるその実際の有効性が確認されています。

要約(オリジナル)

Behavior Trees (BTs) are increasingly becoming a popular control structure in robotics due to their modularity, reactivity, and robustness. In terms of BT generation methods, BT planning shows promise for generating reliable BTs. However, the scalability of BT planning is often constrained by prolonged planning times in complex scenarios, largely due to a lack of domain knowledge. In contrast, pre-trained Large Language Models (LLMs) have demonstrated task reasoning capabilities across various domains, though the correctness and safety of their planning remain uncertain. This paper proposes integrating BT planning with LLM reasoning, introducing Heuristic Behavior Tree Planning (HBTP)-a reliable and efficient framework for BT generation. The key idea in HBTP is to leverage LLMs for task-specific reasoning to generate a heuristic path, which BT planning can then follow to expand efficiently. We first introduce the heuristic BT expansion process, along with two heuristic variants designed for optimal planning and satisficing planning, respectively. Then, we propose methods to address the inaccuracies of LLM reasoning, including action space pruning and reflective feedback, to further enhance both reasoning accuracy and planning efficiency. Experiments demonstrate the theoretical bounds of HBTP, and results from four datasets confirm its practical effectiveness in everyday service robot applications.

arxiv情報

著者 Yishuai Cai,Xinglin Chen,Yunxin Mao,Minglong Li,Shaowu Yang,Wenjing Yang,Ji Wang
発行日 2024-10-09 08:55:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

ScissorBot: Learning Generalizable Scissor Skill for Paper Cutting via Simulation, Imitation, and Sim2Real

要約

この論文では、ハサミを使用して一般化可能な紙を切断するという難しいロボット タスクに取り組みます。
上端を固定して吊るした紙に描かれた曲線を、ロボットアームに取り付けたハサミを駆動して正確に切る作業です。
頻繁に紙とハサミが接触し、その結果として破損するため、紙は継続的に変形し、トポロジーが変化するという特徴があり、正確なモデリングが困難です。
効果的な実行を保証するために、模倣学習用のアクション プリミティブ シーケンスをカスタマイズしてアクション スペースを制限し、潜在的な複合エラーを軽減します。
最後に、シミュレーションと現実の間のギャップを埋めるためにシミュレーションと現実のテクニックを統合することにより、私たちのポリシーを実際のロボットに効果的に展開できます。
実験結果は、私たちの方法がシミュレーションと現実世界のベンチマークの両方ですべてのベースラインを上回り、同じ条件下で人間の片手による操作に匹敵するパフォーマンスを達成することを示しています。

要約(オリジナル)

This paper tackles the challenging robotic task of generalizable paper cutting using scissors. In this task, scissors attached to a robot arm are driven to accurately cut curves drawn on the paper, which is hung with the top edge fixed. Due to the frequent paper-scissor contact and consequent fracture, the paper features continual deformation and changing topology, which is diffult for accurate modeling. To ensure effective execution, we customize an action primitive sequence for imitation learning to constrain its action space, thus alleviating potential compounding errors. Finally, by integrating sim-to-real techniques to bridge the gap between simulation and reality, our policy can be effectively deployed on the real robot. Experimental results demonstrate that our method surpasses all baselines in both simulation and real-world benchmarks and achieves performance comparable to human operation with a single hand under the same conditions.

arxiv情報

著者 Jiangran Lyu,Yuxing Chen,Tao Du,Feng Zhu,Huiquan Liu,Yizhou Wang,He Wang
発行日 2024-10-09 08:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Autonomous localization of multiple ionizing radiation sources using miniature single-layer Compton cameras onboard a group of micro aerial vehicles

要約

この論文では、超小型航空機 (MAV) のグループを使用して複数のガンマ線源の自律位置を特定するための新しい方法を紹介します。
この方法では、非常に軽量 (44 g) のコンプトン カメラ MiniPIX TPX3 を使用します。
検出器のコンパクトなサイズにより、安全かつ機敏な小型無人航空機 (UAV) への搭載が可能になります。
提案された放射線マッピング手法は、複数の分散型コンプトン カメラ センサーからの測定値を融合して、複数の放射線源の位置をリアルタイムで正確に推定します。
一般に使用される強度ベースの検出器とは異なり、コンプトン カメラは、単一の電離粒子から放射線源に向かう可能性のある一連の方向を再構成します。
したがって、提案されたアプローチは、より長い測定を必要とする放射線場の勾配や等高線を推定することなく、放射線源の位置を特定することができます。
瞬時の推定により、機動性の高い MAV の可能性を最大限に活用できます。
放射線マッピング手法は、放射線源の位置推定の品質を向上させ、対象領域をより迅速に探索するために、MAV の今後の動作を調整するアクティブ探索戦略と組み合わされます。
提案されたソリューションは、複数のセシウム 137 放射線源を使用したシミュレーションと実際の実験で評価されます。

要約(オリジナル)

A novel method for autonomous localization of multiple sources of gamma radiation using a group of Micro Aerial Vehicles (MAVs) is presented in this paper. The method utilizes an extremely lightweight (44 g) Compton camera MiniPIX TPX3. The compact size of the detector allows for deployment onboard safe and agile small-scale Unmanned Aerial Vehicles (UAVs). The proposed radiation mapping approach fuses measurements from multiple distributed Compton camera sensors to accurately estimate the positions of multiple radioactive sources in real time. Unlike commonly used intensity-based detectors, the Compton camera reconstructs the set of possible directions towards a radiation source from just a single ionizing particle. Therefore, the proposed approach can localize radiation sources without having to estimate the gradient of a radiation field or contour lines, which require longer measurements. The instant estimation is able to fully exploit the potential of highly mobile MAVs. The radiation mapping method is combined with an active search strategy, which coordinates the future actions of the MAVs in order to improve the quality of the estimate of the sources’ positions, as well as to explore the area of interest faster. The proposed solution is evaluated in simulation and real world experiments with multiple Cesium-137 radiation sources.

arxiv情報

著者 Michal Werner,Tomáš Báča,Petr Štibinger,Daniela Doubravová,Jaroslav Šolc,Jan Rusňák,Martin Saska
発行日 2024-10-09 08:59:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

OmniPose6D: Towards Short-Term Object Pose Tracking in Dynamic Scenes from Monocular RGB

要約

単眼 RGB 入力を使用した動的環境における短期的なオブジェクトの姿勢追跡の課題に対処するために、現実世界の条件の多様性を反映するように作成された大規模な合成データセット OmniPose6D を導入します。
さらに、姿勢追跡アルゴリズムを包括的に比較するためのベンチマーク フレームワークも紹介します。
確率的モデリングを採用して姿勢推定を改良する、不確実性を認識したキーポイント改良ネットワークを特徴とするパイプラインを提案します。
比較評価により、私たちのアプローチが実際のデータセットで既存のベースラインよりも優れたパフォーマンスを達成していることが実証され、動的コンテキストでの追跡精度を向上させる際の合成データセットと洗練技術の有効性が強調されています。
私たちの貢献は、複雑なシーンにおけるオブジェクトの姿勢追跡手法の開発と評価における新たな先例を作りました。

要約(オリジナル)

To address the challenge of short-term object pose tracking in dynamic environments with monocular RGB input, we introduce a large-scale synthetic dataset OmniPose6D, crafted to mirror the diversity of real-world conditions. We additionally present a benchmarking framework for a comprehensive comparison of pose tracking algorithms. We propose a pipeline featuring an uncertainty-aware keypoint refinement network, employing probabilistic modeling to refine pose estimation. Comparative evaluations demonstrate that our approach achieves performance superior to existing baselines on real datasets, underscoring the effectiveness of our synthetic dataset and refinement technique in enhancing tracking precision in dynamic contexts. Our contributions set a new precedent for the development and assessment of object pose tracking methodologies in complex scenes.

arxiv情報

著者 Yunzhi Lin,Yipu Zhao,Fu-Jen Chu,Xingyu Chen,Weiyao Wang,Hao Tang,Patricio A. Vela,Matt Feiszli,Kevin Liang
発行日 2024-10-09 09:01:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | コメントする

Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約

シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するための重要なステップとなります。
実際、企業が社内テストまたは外部委託テストでサードパーティの汎用シミュレータに依存する場合、テスト結果を実際の自動運転車に一般化できるかどうかが危険にさらされます。
このペーパーでは、デジタル 兄弟の概念を導入することでシミュレーション ベースのテストを強化します。これは、異なるテクノロジで構築された複数の汎用シミュレータ上で特定の自動運転車をテストするマルチ シミュレータ アプローチであり、テスト プロセスにおいてアンサンブルとして集合的に動作します。

自動運転車の車線維持コンポーネントのテストに焦点を当てたケーススタディで、当社のアプローチを例示します。
私たちは 2 つのオープンソース シミュレーターをデジタルの兄弟として使用し、このようなマルチ シミュレーターのアプローチを、大規模なテスト ケースで物理的にスケールされた自動運転車のデジタル ツインと実証的に比較します。
私たちのアプローチでは、道路ポイントのシーケンスの形式で、個々のシミュレーターごとにテスト ケースを生成して実行する必要があります。
次に、機能マップを使用して、テスト ケースがシミュレーター間で移行され、練習された運転条件が特徴付けられます。
最後に、共同で予測される故障確率が計算され、兄弟間で一致した場合にのみ故障が報告されます。
私たちの経験的評価は、デジタル兄弟によるアンサンブル障害予測器が、デジタルツインの障害予測において個々のシミュレータよりも優れていることを示しています。
私たちのケーススタディの結果について説明し、私たちのアプローチが自動運転ソフトウェアの自動テストに関心のある研究者にどのように役立つかを詳しく説明します。

要約(オリジナル)

Simulation-based testing represents an important step to ensure the reliability of autonomous driving software. In practice, when companies rely on third-party general-purpose simulators, either for in-house or outsourced testing, the generalizability of testing results to real autonomous vehicles is at stake. In this paper, we enhance simulation-based testing by introducing the notion of digital siblings, a multi-simulator approach that tests a given autonomous vehicle on multiple general-purpose simulators built with different technologies, that operate collectively as an ensemble in the testing process. We exemplify our approach on a case study focused on testing the lane-keeping component of an autonomous vehicle. We use two open-source simulators as digital siblings, and we empirically compare such a multi-simulator approach against a digital twin of a physical scaled autonomous vehicle on a large set of test cases. Our approach requires generating and running test cases for each individual simulator, in the form of sequences of road points. Then, test cases are migrated between simulators, using feature maps to characterize the exercised driving conditions. Finally, the joint predicted failure probability is computed, and a failure is reported only in cases of agreement among the siblings. Our empirical evaluation shows that the ensemble failure predictor by the digital siblings is superior to each individual simulator at predicting the failures of the digital twin. We discuss the findings of our case study and detail how our approach can help researchers interested in automated testing of autonomous driving software.

arxiv情報

著者 Matteo Biagiola,Andrea Stocco,Vincenzo Riccio,Paolo Tonella
発行日 2024-10-09 09:14:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | コメントする

PointNetPGAP-SLC: A 3D LiDAR-based Place Recognition Approach with Segment-level Consistency Training for Mobile Robots in Horticulture

要約

3D LiDAR ベースの場所認識は、レーザー光線に対して半透過性であるため、独特の課題を抱えている園芸環境では依然としてほとんど研究されていません。
この特性により、多くの場合、隣接する行からの LiDAR スキャンが非常に類似する結果となり、記述子のあいまいさが生じ、その結果、検索パフォーマンスが低下します。
この研究では、園芸環境における 3D LiDAR の場所認識の課題に対処し、特に 3 つの重要な貢献を導入することで列間のあいまいさに焦点を当てます: (i) 統計的にインスピレーションを得た 2 つのアグリゲーターの出力を組み合わせた新しいモデル PointNetPGAP
単一の記述子。
(ii) セグメントレベルの一貫性 (SLC) モデル。記述子の堅牢性を高めるためにトレーニング中にのみ使用されます。
(iii) 果樹園とイチゴ畑からの LiDAR シーケンスを含む、HORTO-3DLM データセット。
HORTO-3DLM および KITTI オドメトリ データセットに対して行われた実験評価では、特に SLC モデルが適用された場合に、PointNetPGAP が OverlapTransformer や PointNetVLAD などの最先端のモデルよりも優れたパフォーマンスを発揮することが実証されています。
これらの結果は、曖昧性の高いセグメントでの検索パフォーマンスを大幅に向上させることにより、特に園芸環境においてこのモデルの優位性を強調しています。

要約(オリジナル)

3D LiDAR-based place recognition remains largely underexplored in horticultural environments, which present unique challenges due to their semi-permeable nature to laser beams. This characteristic often results in highly similar LiDAR scans from adjacent rows, leading to descriptor ambiguity and, consequently, compromised retrieval performance. In this work, we address the challenges of 3D LiDAR place recognition in horticultural environments, particularly focusing on inter-row ambiguity by introducing three key contributions: (i) a novel model, PointNetPGAP, which combines the outputs of two statistically-inspired aggregators into a single descriptor; (ii) a Segment-Level Consistency (SLC) model, used exclusively during training to enhance descriptor robustness; and (iii) the HORTO-3DLM dataset, comprising LiDAR sequences from orchards and strawberry fields. Experimental evaluations conducted on the HORTO-3DLM and KITTI Odometry datasets demonstrate that PointNetPGAP outperforms state-of-the-art models, including OverlapTransformer and PointNetVLAD, particularly when the SLC model is applied. These results underscore the model’s superiority, especially in horticultural environments, by significantly improving retrieval performance in segments with higher ambiguity.

arxiv情報

著者 T. Barros,L. Garrote,P. Conde,M. J. Coombes,C. Liu,C. Premebida,U. J. Nunes
発行日 2024-10-09 09:29:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Collective perception for tracking people with a robot swarm

要約

群れの知覚とは、ロボットの群れが個々のロボットの知覚能力を利用して、環境についての集合的な理解を形成する能力を指します。
その分散型の性質により、ロボット群は空間全体に一定の存在を維持することで動的環境を継続的に監視することができます。この研究では、ロボット群を使用した人々の集団追跡に関する予備実験を紹介します。
この実験は、さまざまなサイズの群れを含む 4 つの異なるオフィス環境にわたるシミュレーションで実施されました。
ロボットには、現実世界のオフィス環境の写真のデータセットからサンプリングされた画像が提供されました。私たちは、ロボットが場所を変える人を検出し、その情報を群れの一部に伝播するのに必要な時間分布を測定しました。
この結果は、ロボット群が動的環境の監視において大きな可能性を示していることを示しています。

要約(オリジナル)

Swarm perception refers to the ability of a robot swarm to utilize the perception capabilities of each individual robot, forming a collective understanding of the environment. Their distributed nature enables robot swarms to continuously monitor dynamic environments by maintaining a constant presence throughout the space.In this study, we present a preliminary experiment on the collective tracking of people using a robot swarm. The experiment was conducted in simulation across four different office environments, with swarms of varying sizes. The robots were provided with images sampled from a dataset of real-world office environment pictures.We measured the time distribution required for a robot to detect a person changing location and to propagate this information to increasing fractions of the swarm. The results indicate that robot swarms show significant promise in monitoring dynamic environments.

arxiv情報

著者 Miquel Kegeleirs,David Garzón Ramos,Guillermo Legarda Herranz,Ilyes Gharbi,Jeanne Szpirer,Olivier Debeir,Ken Hasselmann,Lorenzo Garattoni,Gianpiero Francesca,Mauro Birattari
発行日 2024-10-09 09:43:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Discrete time model predictive control for humanoid walking with step adjustment

要約

この論文では、オンライン足音調整を備えたヒューマノイド歩行のための離散時間モデル予測コントローラー (MPC) を紹介します。
提案されたコントローラは階層制御アプローチを利用します。
高レベルのコントローラーは、低次元の線形倒立振子モデル (LIPM) を使用して、望ましい足の位置と重心 (CoM) の動きを決定し、望ましい速度を維持しながら転倒を防止します。
次に、タスク スペース コントローラー (TSC) が、上位コントローラーから取得した目的の動きを追跡し、ヒューマノイドの全身ダイナミクスを利用します。
私たちのアプローチは、事前に定義されたフットプランや参照圧力中心 (CoP) 軌道に依存しないという点で、歩行パターン生成のための既存の MPC 手法とは異なります。
全体的なアプローチは、トルク制御されたヒューマノイド ロボットのシミュレーションでテストされます。
結果は、提案された制御アプローチが安定した歩行を生成し、押しの外乱に対する転倒を防止することを示しています。

要約(オリジナル)

This paper presents a Discrete-Time Model Predictive Controller (MPC) for humanoid walking with online footstep adjustment. The proposed controller utilizes a hierarchical control approach. The high-level controller uses a low-dimensional Linear Inverted Pendulum Model (LIPM) to determine desired foot placement and Center of Mass (CoM) motion, to prevent falls while maintaining the desired velocity. A Task Space Controller (TSC) then tracks the desired motion obtained from the high-level controller, exploiting the whole-body dynamics of the humanoid. Our approach differs from existing MPC methods for walking pattern generation by not relying on a predefined foot-plan or a reference center of pressure (CoP) trajectory. The overall approach is tested in simulation on a torque-controlled Humanoid Robot. Results show that proposed control approach generates stable walking and prevents fall against push disturbances.

arxiv情報

著者 Vishnu Joshi,Suraj Kumar,Nithin V,Shishir Kolathaya
発行日 2024-10-09 11:40:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Hi-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting

要約

我々は、新しい階層的カテゴリ表現を特徴とするセマンティック 3D ガウス スプラッティング SLAM 手法である Hi-SLAM を提案します。これにより、3D 世界での正確なグローバル 3D セマンティック マッピング、スケールアップ機能、および明示的なセマンティック ラベル予測が可能になります。
セマンティック SLAM システムでのパラメータの使用量は、環境の複雑さが増すにつれて大幅に増加しており、シーンの理解が特に困難でコストがかかるものになっています。
この問題に対処するために、大規模言語モデル (LLM) の機能を活用して、コンパクトな形式でセマンティック情報を 3D ガウス スプラッティングにエンコードする新しい階層表現を導入します。
さらに、レベル間最適化とレベル間最適化の両方を通じて階層的意味論的情報を最適化するように設計された新しい意味論的損失を導入します。
さらに、SLAM システム全体を強化し、トラッキングとマッピングのパフォーマンスを向上させました。
当社の Hi-SLAM は、マッピング精度と追跡精度の両方で既存の高密度 SLAM 方式を上回り、2 倍の動作速度向上を達成します。
さらに、ストレージとトレーニング時間の要件を大幅に削減しながら、小さな合成シーンでセマンティック セグメンテーションをレンダリングする際に優れたパフォーマンスを発揮します。
レンダリング FPS は、セマンティック情報を使用すると 2,000、セマンティック情報を使用しない場合は 3,000 に見事に達します。
最も注目すべきは、500 を超えるセマンティック クラスを使用して複雑な現実世界のシーンを処理する機能を示し、その貴重なスケールアップ機能を強調していることです。

要約(オリジナル)

We propose Hi-SLAM, a semantic 3D Gaussian Splatting SLAM method featuring a novel hierarchical categorical representation, which enables accurate global 3D semantic mapping, scaling-up capability, and explicit semantic label prediction in the 3D world. The parameter usage in semantic SLAM systems increases significantly with the growing complexity of the environment, making it particularly challenging and costly for scene understanding. To address this problem, we introduce a novel hierarchical representation that encodes semantic information in a compact form into 3D Gaussian Splatting, leveraging the capabilities of large language models (LLMs). We further introduce a novel semantic loss designed to optimize hierarchical semantic information through both inter-level and cross-level optimization. Furthermore, we enhance the whole SLAM system, resulting in improved tracking and mapping performance. Our Hi-SLAM outperforms existing dense SLAM methods in both mapping and tracking accuracy, while achieving a 2x operation speed-up. Additionally, it exhibits competitive performance in rendering semantic segmentation in small synthetic scenes, with significantly reduced storage and training time requirements. Rendering FPS impressively reaches 2,000 with semantic information and 3,000 without it. Most notably, it showcases the capability of handling the complex real-world scene with more than 500 semantic classes, highlighting its valuable scaling-up capability.

arxiv情報

著者 Boying Li,Zhixi Cai,Yuan-Fang Li,Ian Reid,Hamid Rezatofighi
発行日 2024-10-09 11:48:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

Dynamic Neural Potential Field: Online Trajectory Optimization in Presence of Moving Obstacles

要約

静的および動的障害物が存在する場合の移動ロボットの局所的な軌道計画のタスクに取り組みます。
ローカル軌道は、モデル予測制御 (MPC) 問題の数値解として取得されます。
衝突回避は、障害物の反発力を MPC のコスト関数に追加することによって実現できます。
私たちは、神経モデルによって斥力の可能性を推定するアプローチを開発します。
動的障害物に対処する 3 つの可能な戦略を提案し、検討します。
まず、動的な障害物のある環境を一連の静的な環境として考えます。
第二に、神経モデルは一連の反発ポテンシャルを一度に予測します。
第三に、ニューラル モデルは、自己回帰モードで将来の反発力の可能性を段階的に予測します。
これらの戦略を実装し、BenchMR フレームワークを使用して CIAO* および MPPI と比較します。
最初の 2 つの戦略は、安全上の制約を維持しながら、CIAO* および MPPI よりも高いパフォーマンスを示しました。
3 番目の戦略は少し時間がかかりましたが、それでも時間制限は満たしています。
私たちは、提案された MPC ローカル軌道プランナーの下でオフィスの廊下を移動する Husky UGV モバイル プラットフォームにアプローチを展開します。
コードとトレーニング済みモデルは \url{https://github.com/CognitiveAISystems/Dynamic-Neural-Potential-Field} で入手できます。

要約(オリジナル)

We address a task of local trajectory planning for the mobile robot in the presence of static and dynamic obstacles. Local trajectory is obtained as a numerical solution of the Model Predictive Control (MPC) problem. Collision avoidance may be provided by adding repulsive potential of the obstacles to the cost function of MPC. We develop an approach, where repulsive potential is estimated by the neural model. We propose and explore three possible strategies of handling dynamic obstacles. First, environment with dynamic obstacles is considered as a sequence of static environments. Second, the neural model predict a sequence of repulsive potential at once. Third, the neural model predict future repulsive potential step by step in autoregressive mode. We implement these strategies and compare it with CIAO* and MPPI using BenchMR framework. First two strategies showed higher performance than CIAO* and MPPI while preserving safety constraints. The third strategy was a bit slower, however it still satisfy time limits. We deploy our approach on Husky UGV mobile platform, which move through the office corridors under proposed MPC local trajectory planner. The code and trained models are available at \url{https://github.com/CognitiveAISystems/Dynamic-Neural-Potential-Field}.

arxiv情報

著者 Aleksey Staroverov,Muhammad Alhaddad,Aditya Narendra,Konstantin Mironov,Aleksandr Panov
発行日 2024-10-09 12:27:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする