Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions

要約

複雑でマルチモーダルのトラフィックシナリオでスケーラブルなリアルタイムモデル予測制御(MPC)のために設計された階層アーキテクチャを提案します。
このアーキテクチャは、2つの重要なコンポーネントで構成されています。1)ラグランジアンの二重性を使用した周囲の車両との間のMPC予測範囲に沿った関連する相互作用を予測する新しい注意ベースの再発性ニューラルネットワークであるRAID-NET、および2)無気力な衝突回避を排除する確率MPC問題の減少、コンピューティングの衝突の増加、
私たちのアプローチは、インタラクティブな周囲の車両とのシミュレートされた交通交差点で実証されており、モーション計画の問題を解決する際に12倍のスピードアップを示しています。
複数の複雑なトラフィックシナリオで提案されたアーキテクチャを示すビデオは、https://youtu.be/-prionpb9_cにあります。
github:https://github.com/mpc-berkeley/hmpc_raidnet

要約(オリジナル)

We propose a hierarchical architecture designed for scalable real-time Model Predictive Control (MPC) in complex, multi-modal traffic scenarios. This architecture comprises two key components: 1) RAID-Net, a novel attention-based Recurrent Neural Network that predicts relevant interactions along the MPC prediction horizon between the autonomous vehicle and the surrounding vehicles using Lagrangian duality, and 2) a reduced Stochastic MPC problem that eliminates irrelevant collision avoidance constraints, enhancing computational efficiency. Our approach is demonstrated in a simulated traffic intersection with interactive surrounding vehicles, showcasing a 12x speed-up in solving the motion planning problem. A video demonstrating the proposed architecture in multiple complex traffic scenarios can be found here: https://youtu.be/-pRiOnPb9_c. GitHub: https://github.com/MPC-Berkeley/hmpc_raidnet

arxiv情報

著者 Hansung Kim,Siddharth H. Nair,Francesco Borrelli
発行日 2025-03-31 04:38:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions はコメントを受け付けていません

Towards a cognitive architecture to enable natural language interaction in co-constructive task learning

要約

この研究では、認知アーキテクチャが共同建設タスク学習(CCTL)において自然言語の利点を活用する必要がある特徴がある質問に対処します。
コンテキストを提供するために、最初にインタラクティブタスク学習(ITL)、人間の記憶システムのメカニズム、および自然言語とマルチモダリティの重要性について説明します。
次に、認知アーキテクチャの現在の状態を調べ、それらの機能を分析して、複数のソースに基づいたCCTLの概念を通知します。
次に、さまざまな研究ドメインからの洞察を統合して、統一されたフレームワークを開発します。
最後に、ヒトロボット相互作用(HRI)でCCTLを達成するために必要な残りの課題と要件を特定することで結論付けます。

要約(オリジナル)

This research addresses the question, which characteristics a cognitive architecture must have to leverage the benefits of natural language in Co-Constructive Task Learning (CCTL). To provide context, we first discuss Interactive Task Learning (ITL), the mechanisms of the human memory system, and the significance of natural language and multi-modality. Next, we examine the current state of cognitive architectures, analyzing their capabilities to inform a concept of CCTL grounded in multiple sources. We then integrate insights from various research domains to develop a unified framework. Finally, we conclude by identifying the remaining challenges and requirements necessary to achieve CCTL in Human-Robot Interaction (HRI).

arxiv情報

著者 Manuel Scheibl,Birte Richter,Alissa Müller,Michael Beetz,Britta Wrede
発行日 2025-03-31 06:23:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC, cs.RO | Towards a cognitive architecture to enable natural language interaction in co-constructive task learning はコメントを受け付けていません

Trajectory Planning for Automated Driving using Target Funnels

要約

自動運転車は感覚入力に依存して周囲を監視し、最も可能性の高い将来の道路コースに継続的に適応します。
予測軌道計画は、重要な入力として(不確実な)道路コースのスナップショットに基づいています。
ノイズの多い知覚データでは、道路コースの推定値は大きく異なり、優柔不断で不安定なステアリング行動につながります。
この問題を克服するために、このペーパーでは、新しい客観的関数を備えた予測軌跡計画アルゴリズムを紹介します。最も可能性の高い道路コースに基づいて単一の参照軌跡をターゲットにする代わりに、ターゲットファンネルと呼ばれる一連のターゲット参照セットを追跡することを考慮します。
提案された計画アルゴリズムは、道路コースに関する確率的情報を統合し、したがって、道路認識の定期的な更新を暗黙的に考慮します。
私たちのソリューションは、プロトタイプ車両から収集された実際の駆動データを使用して、ケーススタディで評価されます。
結果は、アルゴリズムが追跡精度を維持し、騒々しい道路知覚の存在下で望ましくないステアリングコマンドを大幅に削減し、確実性の同等の定式化と比較して56%の投入コストを削減することを示しています。

要約(オリジナル)

Self-driving vehicles rely on sensory input to monitor their surroundings and continuously adapt to the most likely future road course. Predictive trajectory planning is based on snapshots of the (uncertain) road course as a key input. Under noisy perception data, estimates of the road course can vary significantly, leading to indecisive and erratic steering behavior. To overcome this issue, this paper introduces a predictive trajectory planning algorithm with a novel objective function: instead of targeting a single reference trajectory based on the most likely road course, tracking a series of target reference sets, called a target funnel, is considered. The proposed planning algorithm integrates probabilistic information about the road course, and thus implicitly considers regular updates to road perception. Our solution is assessed in a case study using real driving data collected from a prototype vehicle. The results demonstrate that the algorithm maintains tracking accuracy and substantially reduces undesirable steering commands in the presence of noisy road perception, achieving a 56% reduction in input costs compared to a certainty equivalent formulation.

arxiv情報

著者 Benjamin Bogenberger,Johannes Bürger,Vladislav Nenchev
発行日 2025-03-31 07:15:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Trajectory Planning for Automated Driving using Target Funnels はコメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約

自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの使用を提案します。
世界モデルは、過去の状態と行動を与えられたエージェントの次の状態を予測できるニューラルネットワークです。
トレーニング中に世界モデルを活用することにより、運転ポリシーは、過剰な量のトレーニングデータを必要とせずに共変量シフトを効果的に軽減します。
エンドツーエンドのトレーニング中に、私たちのポリシーは、人間のデモで観察された状態と連携することにより、エラーから回復する方法を学び、実行時にトレーニング分布外の摂動から回復できるようにします。
さらに、マルチビューの相互参加と学習シーンクエリを採用する新しいトランスベースのPerception Encoderを紹介します。
定性的および定量的な結果を提示し、カーラシミュレーターでのクローズドループテストにおける以前の最先端の最新技術に関する大幅な改善を示し、カーラとナヴィディアのドライブSIMの両方で摂動を処理する能力を示しています。

要約(オリジナル)

We propose the use of latent space generative world models to address the covariate shift problem in autonomous driving. A world model is a neural network capable of predicting an agent’s next state given past states and actions. By leveraging a world model during training, the driving policy effectively mitigates covariate shift without requiring an excessive amount of training data. During end-to-end training, our policy learns how to recover from errors by aligning with states observed in human demonstrations, so that at runtime it can recover from perturbations outside the training distribution. Additionally, we introduce a novel transformer-based perception encoder that employs multi-view cross-attention and a learned scene query. We present qualitative and quantitative results, demonstrating significant improvements upon prior state of the art in closed-loop testing in the CARLA simulator, as well as showing the ability to handle perturbations in both CARLA and NVIDIA’s DRIVE Sim.

arxiv情報

著者 Alexander Popov,Alperen Degirmenci,David Wehr,Shashank Hegde,Ryan Oldja,Alexey Kamenev,Bertrand Douillard,David Nistér,Urs Muller,Ruchi Bhargava,Stan Birchfield,Nikolai Smolyanskiy
発行日 2025-03-31 07:26:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models はコメントを受け付けていません

Disambiguate Gripper State in Grasp-Based Tasks: Pseudo-Tactile as Feedback Enables Pure Simulation Learning

要約

把握ベースの操作タスクは、環境と相互作用するロボットの基本ですが、グリッパー状態のあいまいさは、これらのタスクの模倣学習ポリシーの堅牢性を大幅に低下させます。
データ駆動型ソリューションは、現実世界の高いデータコストの課題に直面していますが、シミュレーションデータは、低コストにもかかわらず、SIMからリアルのギャップによって制限されています。
グリッパー状態のあいまいさの根本原因を触覚フィードバックの欠如として特定します。
これに対処するために、触覚センサーとしてフォース制御グリッパーを使用するというアイデアに触発された、フィードバックとして擬似タクタイルを使用する新しいアプローチを提案します。
この方法は、追加のデータ収集とハードウェアの関与なしにポリシーの堅牢性を高め、ポリシーのノイズフリーのバイナリグリッパー状態観測を提供し、シミュレーションの力を解き放つために純粋なシミュレーション学習を促進します。
3つの実際の把握ベースのタスクにわたる実験結果は、アプローチの必要性、有効性、効率性を示しています。

要約(オリジナル)

Grasp-based manipulation tasks are fundamental to robots interacting with their environments, yet gripper state ambiguity significantly reduces the robustness of imitation learning policies for these tasks. Data-driven solutions face the challenge of high real-world data costs, while simulation data, despite its low costs, is limited by the sim-to-real gap. We identify the root cause of gripper state ambiguity as the lack of tactile feedback. To address this, we propose a novel approach employing pseudo-tactile as feedback, inspired by the idea of using a force-controlled gripper as a tactile sensor. This method enhances policy robustness without additional data collection and hardware involvement, while providing a noise-free binary gripper state observation for the policy and thus facilitating pure simulation learning to unleash the power of simulation. Experimental results across three real-world grasp-based tasks demonstrate the necessity, effectiveness, and efficiency of our approach.

arxiv情報

著者 Yifei Yang,Lu Chen,Zherui Song,Yenan Chen,Wentao Sun,Zhongxiang Zhou,Rong Xiong,Yue Wang
発行日 2025-03-31 08:29:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Disambiguate Gripper State in Grasp-Based Tasks: Pseudo-Tactile as Feedback Enables Pure Simulation Learning はコメントを受け付けていません

Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections

要約

信号のない交差点を介した安全で効率的な軌道を計画することは、特に予測不可能な相互作用と紛争の可能性が高まる動的なマルチタスク環境で、自律車(AVS)に重大な課題をもたらします。
この研究の目的は、3つの異なる交差点の動きにわたる安全性と効率性を確保するために、統一された堅牢な適応型フレームワークを開発することにより、これらの課題に対処することを目的としています。
既存の方法は、安全性を確保し、そのような環境でのデモンストレーションからマルチタスクの動作を効果的に学習するために、しばしば苦労しています。
この研究は、動的な高次制御バリア関数(DHOCBF)を、動的安全性批判ディフューザー(DSC-Diffuser)と呼ばれる拡散ベースのモデルと統合する安全性批判的な計画方法を提案します。
DSC-Diffuserは、効率を向上させるためにタスク誘導計画を活用し、実際の専門家デモンストレーションから複数の運転タスクの同時学習を可能にします。
さらに、目標指向の制約を組み込むと、変位エラーが大幅に減少し、正確な軌跡の実行が確保されます。
動的環境での安全性をさらに確保するために、提案されたDHOCBFフレームワークは、周囲の車両の動きを説明するように動的に調整され、従来の制御バリア機能と比較して適応性が向上し、保守主義を減らします。
数値シミュレーションを通じて実施されるDHOCBFの妥当性評価は、障害物の速度、サイズ、不確実性、および場所の変動に適応する際にその堅牢性を示し、幅広い複雑で不確実なシナリオの運転安全性を効果的に維持します。
包括的なパフォーマンス評価は、DSC-Diffuserが現実的で安定した一般化可能なポリシーを生成し、複雑なマルチタスク運転シナリオで柔軟性と信頼できる安全保証を提供することを示しています。

要約(オリジナル)

Planning safe and efficient trajectories through signal-free intersections presents significant challenges for autonomous vehicles (AVs), particularly in dynamic, multi-task environments with unpredictable interactions and an increased possibility of conflicts. This study aims to address these challenges by developing a unified, robust, adaptive framework to ensure safety and efficiency across three distinct intersection movements: left-turn, right-turn, and straight-ahead. Existing methods often struggle to reliably ensure safety and effectively learn multi-task behaviors from demonstrations in such environments. This study proposes a safety-critical planning method that integrates Dynamic High-Order Control Barrier Functions (DHOCBF) with a diffusion-based model, called Dynamic Safety-Critical Diffuser (DSC-Diffuser). The DSC-Diffuser leverages task-guided planning to enhance efficiency, allowing the simultaneous learning of multiple driving tasks from real-world expert demonstrations. Moreover, the incorporation of goal-oriented constraints significantly reduces displacement errors, ensuring precise trajectory execution. To further ensure driving safety in dynamic environments, the proposed DHOCBF framework dynamically adjusts to account for the movements of surrounding vehicles, offering enhanced adaptability and reduce the conservatism compared to traditional control barrier functions. Validity evaluations of DHOCBF, conducted through numerical simulations, demonstrate its robustness in adapting to variations in obstacle velocities, sizes, uncertainties, and locations, effectively maintaining driving safety across a wide range of complex and uncertain scenarios. Comprehensive performance evaluations demonstrate that DSC-Diffuser generates realistic, stable, and generalizable policies, providing flexibility and reliable safety assurance in complex multi-task driving scenarios.

arxiv情報

著者 Di Chen,Ruiguo Zhong,Kehua Chen,Zhiwei Shang,Meixin Zhu,Edward Chung
発行日 2025-03-31 08:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections はコメントを受け付けていません

GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models

要約

マルチロボットシステムの制御ポリシーの開発は、従来、複雑で労働集約的なプロセスに従っており、多くの場合、動的タスクに適応する柔軟性が欠けています。
これにより、制御ポリシーを自動的に作成する方法に関する研究が動機付けられています。
ただし、これらの方法では、手動で客観的機能を作成および改良するための反復プロセスが必要であり、それにより開発サイクルが長くなります。
この作業では、大規模な言語モデルを活用して自然言語の単純なユーザー命令に基づいてマルチロボットタスクの制御ポリシーを自動的に生成および展開するエンドツーエンドシステムである\ textit {genswarm}を導入します。
多言語のエージェントシステムとして、Genswarmはゼロショット学習を達成し、変更または目に見えないタスクに迅速に適応できるようにします。
コードポリシーのホワイトボックスの性質により、強い再現性と解釈可能性が保証されます。
スケーラブルなソフトウェアとハ​​ードウェアアーキテクチャにより、Genswarmは、シミュレートされたマルチロボットシステムと実世界の両方のマルチロボットシステムの効率的なポリシー展開をサポートし、ロボット工学の専門家と非専門家にとって価値があることを証明できるエンドツーエンドの機能を実現します。

要約(オリジナル)

The development of control policies for multi-robot systems traditionally follows a complex and labor-intensive process, often lacking the flexibility to adapt to dynamic tasks. This has motivated research on methods to automatically create control policies. However, these methods require iterative processes of manually crafting and refining objective functions, thereby prolonging the development cycle. This work introduces \textit{GenSwarm}, an end-to-end system that leverages large language models to automatically generate and deploy control policies for multi-robot tasks based on simple user instructions in natural language. As a multi-language-agent system, GenSwarm achieves zero-shot learning, enabling rapid adaptation to altered or unseen tasks. The white-box nature of the code policies ensures strong reproducibility and interpretability. With its scalable software and hardware architectures, GenSwarm supports efficient policy deployment on both simulated and real-world multi-robot systems, realizing an instruction-to-execution end-to-end functionality that could prove valuable for robotics specialists and non-specialists alike.The code of the proposed GenSwarm system is available online: https://github.com/WindyLab/GenSwarm.

arxiv情報

著者 Wenkang Ji,Huaben Chen,Mingyang Chen,Guobin Zhu,Lufeng Xu,Roderich Groß,Rui Zhou,Ming Cao,Shiyu Zhao
発行日 2025-03-31 09:26:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, cs.RO | GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models はコメントを受け付けていません

ZeroMimic: Distilling Robotic Manipulation Skills from Web Videos

要約

ロボット操作における最近の多くの進歩は、模倣学習を通じてもたらされていますが、これらは主に特に困難な形のデモンストレーションを模倣することに依存しています。訓練されたポリシーと同じオブジェクトを持つ同じ部屋の同じロボットで収集されたものは、テスト時に処理する必要があります。
対照的に、ロボットの貴重な情報を含む、野生の操作スキルを示す、大規模な事前に記録された人間のビデオデータセットがすでに存在しています。
ロボット固有のデモや探索に関する追加要件なしに、そのようなデータから有用なロボットスキルポリシーのリポジトリを蒸留することは可能ですか?
最初のシステムゼロミミックを提示します。これは、多様なオブジェクトに作用し、多様な目に見えないタスクセットアップ全体に作用できる、いくつかの一般的なカテゴリの操作タスク(開閉、閉鎖、注入、ピック、および攪拌)のために、すぐに展開可能な画像の目標条件付けされたスキルポリシーを生成します。
Zeromimicは、最新の把握アフォーダンス検出器と模倣ポリシークラスとともに、人間のビデオのセマンティックおよび幾何学的な視覚的理解における最近の進歩を活用するように慎重に設計されています。
自我中心の人間のビデオの人気のエピキッチンデータセットでゼロミミックをトレーニングした後、さまざまな現実世界とシミュレートされたキッチン設定でのすぐにボックスのパフォーマンスを評価し、2つの異なるロボット実施形態を備えたシミュレートされたキッチン設定を評価し、これらのさまざまなタスクを処理する印象的な能力を示します。
他のタスクのセットアップやロボットでゼロミミックポリシーをプラグアンドプレイ再利用できるようにするために、スキルポリシーのソフトウェアおよびポリシーチェックポイントをリリースします。

要約(オリジナル)

Many recent advances in robotic manipulation have come through imitation learning, yet these rely largely on mimicking a particularly hard-to-acquire form of demonstrations: those collected on the same robot in the same room with the same objects as the trained policy must handle at test time. In contrast, large pre-recorded human video datasets demonstrating manipulation skills in-the-wild already exist, which contain valuable information for robots. Is it possible to distill a repository of useful robotic skill policies out of such data without any additional requirements on robot-specific demonstrations or exploration? We present the first such system ZeroMimic, that generates immediately deployable image goal-conditioned skill policies for several common categories of manipulation tasks (opening, closing, pouring, pick&place, cutting, and stirring) each capable of acting upon diverse objects and across diverse unseen task setups. ZeroMimic is carefully designed to exploit recent advances in semantic and geometric visual understanding of human videos, together with modern grasp affordance detectors and imitation policy classes. After training ZeroMimic on the popular EpicKitchens dataset of ego-centric human videos, we evaluate its out-of-the-box performance in varied real-world and simulated kitchen settings with two different robot embodiments, demonstrating its impressive abilities to handle these varied tasks. To enable plug-and-play reuse of ZeroMimic policies on other task setups and robots, we release software and policy checkpoints of our skill policies.

arxiv情報

著者 Junyao Shi,Zhuolun Zhao,Tianyou Wang,Ian Pedroza,Amy Luo,Jie Wang,Jason Ma,Dinesh Jayaraman
発行日 2025-03-31 09:27:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | ZeroMimic: Distilling Robotic Manipulation Skills from Web Videos はコメントを受け付けていません

Less is More: Contextual Sampling for Nonlinear Data-Enabled Predictive Control

要約

データ対応予測制御(DEEPC)は、明示的なシステムモデルを必要とせずに、予測制御のための強力なデータ駆動型アプローチです。
ただし、その高い計算コストは​​、リアルタイムロボットシステムへの適用性を制限します。
モーション計画や軌道追跡などのロボットアプリケーションの場合、リアルタイム制御が重要です。
非線形DEEPCは、大規模なデータセットに依存するか、非線形性を学習して予測精度を確保し、高い計算の複雑さにつながります。
この作業では、各時間ステップで最も関連性の高いデータを動的に選択することにより、DEEPCの非線形性を処理するための新しいデータ選択戦略であるコンテキストサンプリングを紹介します。
予測精度を維持しながらデータセットサイズを削減することにより、当社の方法は、リアルタイムロボットアプリケーションのDEEPCの計算効率を改善します。
自律的な車両モーションプランニングのアプローチを検証します。
100のサブトレジェクションのデータセットサイズの場合、コンテキストサンプリングDEEPCは、レバレッジスコアサンプリングと比較して、追跡エラーを53.2%減少させます。
さらに、コンテキストサンプリングは、同等の追跡パフォーマンスを達成しながら、491サブトレジェクションの完全なデータセットを使用する場合と比較して、最大計算時間を87.2%削減します。
これらの結果は、ロボットシステムのリアルタイムのデータ駆動型制御を可能にするコンテキストサンプリングの可能性を強調しています。

要約(オリジナル)

Data-enabled Predictive Control (DeePC) is a powerful data-driven approach for predictive control without requiring an explicit system model. However, its high computational cost limits its applicability to real-time robotic systems. For robotic applications such as motion planning and trajectory tracking, real-time control is crucial. Nonlinear DeePC either relies on large datasets or learning the nonlinearities to ensure predictive accuracy, leading to high computational complexity. This work introduces contextual sampling, a novel data selection strategy to handle nonlinearities for DeePC by dynamically selecting the most relevant data at each time step. By reducing the dataset size while preserving prediction accuracy, our method improves computational efficiency, of DeePC for real-time robotic applications. We validate our approach for autonomous vehicle motion planning. For a dataset size of 100 sub-trajectories, Contextual sampling DeePC reduces tracking error by 53.2 % compared to Leverage Score sampling. Additionally, Contextual sampling reduces max computation time by 87.2 % compared to using the full dataset of 491 sub-trajectories while achieving comparable tracking performance. These results highlight the potential of Contextual sampling to enable real-time, data-driven control for robotic systems.

arxiv情報

著者 Julius Beerwerth,Bassam Alrifaee
発行日 2025-03-31 09:41:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Less is More: Contextual Sampling for Nonlinear Data-Enabled Predictive Control はコメントを受け付けていません

Fast Online Learning of CLiFF-maps in Changing Environments

要約

ダイナミクスのマップは、以前の観察から学んだモーションパターンの効果的な表現であり、最近の研究では、人間を認識したロボットナビゲーション、長期人間の動き予測、ロボットのローカリゼーションなど、さまざまな下流タスクを強化する能力が実証されています。
現在の進歩は、主に、流れが静的な環境、つまり時間の経過とともに変化すると想定されていない環境での人間の流れの地図を学習する方法に集中しています。
このペーパーでは、人間の流れの変化を積極的に検出し、適応するために、クリフマップのオンライン更新方法(モーションパターンを速度と方向の混合物としてモデル化する高度なダイナミクスタイプの高度なマップ)を提案します。
新しい観察結果が収集されると、私たちの目標は、関連する歴史的な動きパターンを保持しながら、崖のマップを効果的かつ正確に統合することです。
提案されたオンライン更新方法は、観測された各位置で確率表現を維持し、十分な統計を継続的に追跡することによりパラメーターを更新します。
合成データセットと実世界の両方のデータセットの両方を使用した実験では、私たちの方法が人間の動きのダイナミクスの正確な表現を維持できることを示しており、高性能の流れに準拠した計画下流タスクに貢献しながら、同等のベースラインよりも大きさが速いことを示しています。

要約(オリジナル)

Maps of dynamics are effective representations of motion patterns learned from prior observations, with recent research demonstrating their ability to enhance various downstream tasks such as human-aware robot navigation, long-term human motion prediction, and robot localization. Current advancements have primarily concentrated on methods for learning maps of human flow in environments where the flow is static, i.e., not assumed to change over time. In this paper we propose an online update method of the CLiFF-map (an advanced map of dynamics type that models motion patterns as velocity and orientation mixtures) to actively detect and adapt to human flow changes. As new observations are collected, our goal is to update a CLiFF-map to effectively and accurately integrate them, while retaining relevant historic motion patterns. The proposed online update method maintains a probabilistic representation in each observed location, updating parameters by continuously tracking sufficient statistics. In experiments using both synthetic and real-world datasets, we show that our method is able to maintain accurate representations of human motion dynamics, contributing to high performance flow-compliant planning downstream tasks, while being orders of magnitude faster than the comparable baselines.

arxiv情報

著者 Yufei Zhu,Andrey Rudenko,Luigi Palmieri,Lukas Heuer,Achim J. Lilienthal,Martin Magnusson
発行日 2025-03-31 09:49:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Fast Online Learning of CLiFF-maps in Changing Environments はコメントを受け付けていません