Joint Moment Estimation for Hip Exoskeleton Control: A Generalized Moment Feature Generation Method

要約

ウォーキング中の股関節のモーメントは、股関節外骨格支援制御の重要な基盤です。
最近の研究では、股関節のモーメントが瞬時に瞬時に多くの利点を提供し、単純なセンサーの要件やさまざまな歩行速度への適応性など、歩行の推定に基づいて支援トルクプロファイルを生成することと比較して多くの利点を提供しています。
ただし、既存の共同モーメント推定方法は、依然としてパーソナライズの欠如に悩まされており、新しいユーザーの推定精度の低下につながります。
課題に対処するために、このペーパーでは、一般化モーメント機能(GMF)に基づいた股関節モーメント推定方法を提案します。
GMFジェネレーターは、専用のデコーダーを介してジョイントモーメントにデコードできるまま、個々のバリエーションに不変の関節モーメントのGMFを学習するために構築されています。
このよく調整された表現を利用して、GRUベースのニューラルネットワークを使用して、HIP外骨格エンコーダで簡単に取得できるジョイントキネマティクスデータを使用してGMFを予測します。
提案された推定方法は、トレッドミルデータセットの28の歩行速度条件下で0.1180 nm/kgの根平均平方根誤差を達成し、ボディパラメーター融合のないモデルと比較して6.5%、ボディパラメーターを使用した従来の融合モデルで8.3%改善します。
さらに、提案された方法は、エンコーダーセンサーのみを備えた股関節外骨格で採用され、レベルグラウンドウォーキングのアシスト状態と比較して、ユーザーの平均20.5%の代謝削減(P <0.01)を達成しました。

要約(オリジナル)

Hip joint moments during walking are the key foundation for hip exoskeleton assistance control. Most recent studies have shown estimating hip joint moments instantaneously offers a lot of advantages compared to generating assistive torque profiles based on gait estimation, such as simple sensor requirements and adaptability to variable walking speeds. However, existing joint moment estimation methods still suffer from a lack of personalization, leading to estimation accuracy degradation for new users. To address the challenges, this paper proposes a hip joint moment estimation method based on generalized moment features (GMF). A GMF generator is constructed to learn GMF of the joint moment which is invariant to individual variations while remaining decodable into joint moments through a dedicated decoder. Utilizing this well-featured representation, a GRU-based neural network is used to predict GMF with joint kinematics data, which can easily be acquired by hip exoskeleton encoders. The proposed estimation method achieves a root mean square error of 0.1180 Nm/kg under 28 walking speed conditions on a treadmill dataset, improved by 6.5% compared to the model without body parameter fusion, and by 8.3% for the conventional fusion model with body parameter. Furthermore, the proposed method was employed on a hip exoskeleton with only encoder sensors and achieved an average 20.5% metabolic reduction (p<0.01) for users compared to assist-off condition in level-ground walking.

arxiv情報

著者 Yuanwen Zhang,Jingfeng Xiong,Haolan Xian,Chuheng Chen,Xinxing Chen,Chenglong Fu,Yuquan Leng
発行日 2025-03-31 01:29:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Joint Moment Estimation for Hip Exoskeleton Control: A Generalized Moment Feature Generation Method はコメントを受け付けていません

A Survey of Reinforcement Learning-Based Motion Planning for Autonomous Driving: Lessons Learned from a Driving Task Perspective

要約

強化学習(RL)は、複雑で動的な意思決定タスクでポリシーを調査および最適化する能力を備えており、自律運転(AD)におけるモーションプランニング(MOP)の課題に対処するための有望なアプローチとして浮上しています。
RLとADの急速な進歩にもかかわらず、多様な運転タスクに合わせたRL設計プロセスの体系的な説明と解釈は未発達のままです。
この調査では、タスク固有の視点からのレッスンに焦点を当てたAD用のRLベースのMOPの包括的なレビューを提供します。
まず、RL方法論の基礎の概要を説明し、次にMOPでアプリケーションを調査し、シナリオ固有の機能とタスク要件を分析して、RL設計の選択肢に対する影響に光を当てます。
この分析に基づいて、主要な設計体験を要約し、さまざまな運転タスクアプリケーションから洞察を抽出し、将来の実装のガイダンスを提供します。
さらに、RLベースのMOPのフロンティアの課題を調べ、これらの課題に対処するための最近の取り組みをレビューし、未解決の問題を克服するための戦略を提案します。

要約(オリジナル)

Reinforcement learning (RL), with its ability to explore and optimize policies in complex, dynamic decision-making tasks, has emerged as a promising approach to addressing motion planning (MoP) challenges in autonomous driving (AD). Despite rapid advancements in RL and AD, a systematic description and interpretation of the RL design process tailored to diverse driving tasks remains underdeveloped. This survey provides a comprehensive review of RL-based MoP for AD, focusing on lessons from task-specific perspectives. We first outline the fundamentals of RL methodologies, and then survey their applications in MoP, analyzing scenario-specific features and task requirements to shed light on their influence on RL design choices. Building on this analysis, we summarize key design experiences, extract insights from various driving task applications, and provide guidance for future implementations. Additionally, we examine the frontier challenges in RL-based MoP, review recent efforts to addresse these challenges, and propose strategies for overcoming unresolved issues.

arxiv情報

著者 Zhuoren Li,Guizhe Jin,Ran Yu,Zhiwen Chen,Nan Li,Wei Han,Lu Xiong,Bo Leng,Jia Hu,Ilya Kolmanovsky,Dimitar Filev
発行日 2025-03-31 01:31:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | A Survey of Reinforcement Learning-Based Motion Planning for Autonomous Driving: Lessons Learned from a Driving Task Perspective はコメントを受け付けていません

Towards Benchmarking and Assessing the Safety and Robustness of Autonomous Driving on Safety-critical Scenarios

要約

自律運転は、認識タスクのパフォーマンス改善やエンドツーエンドの自律駆動システムの開発など、学界と産業の両方で大きな進歩を遂げています。
ただし、自律運転の安全性と堅牢性評価は十分な注目を集めていません。
自律運転の現在の評価は、通常、自然駆動シナリオで行われます。
ただし、多くの事故は、安全性が批判的なシナリオとしても知られているエッジの場合にしばしば発生します。
これらの安全性が批判的なシナリオを収集することは困難であり、現在、安全性が批判的なシナリオを構成するものの明確な定義はありません。
この作業では、安全性の高いシナリオでの自律運転の安全性と堅牢性を探ります。
まず、敵対的な攻撃シナリオや自然分布の変化などの静的なトラフィックシナリオ、および事故シナリオなどの動的なトラフィックシナリオなど、安全性の高いシナリオの定義を提供します。
次に、自律的な運転安全試験プラットフォームを開発して、自律運転システムを包括的に評価し、知覚モジュールの評価だけでなく、システムレベルの評価も網羅しています。
当社の作業は、自律運転のための安全検証プロセスを体系的に構築し、業界が標準化されたテストフレームワークを確立し、実際の道路展開のリスクを削減するための技術サポートを提供します。

要約(オリジナル)

Autonomous driving has made significant progress in both academia and industry, including performance improvements in perception task and the development of end-to-end autonomous driving systems. However, the safety and robustness assessment of autonomous driving has not received sufficient attention. Current evaluations of autonomous driving are typically conducted in natural driving scenarios. However, many accidents often occur in edge cases, also known as safety-critical scenarios. These safety-critical scenarios are difficult to collect, and there is currently no clear definition of what constitutes a safety-critical scenario. In this work, we explore the safety and robustness of autonomous driving in safety-critical scenarios. First, we provide a definition of safety-critical scenarios, including static traffic scenarios such as adversarial attack scenarios and natural distribution shifts, as well as dynamic traffic scenarios such as accident scenarios. Then, we develop an autonomous driving safety testing platform to comprehensively evaluate autonomous driving systems, encompassing not only the assessment of perception modules but also system-level evaluations. Our work systematically constructs a safety verification process for autonomous driving, providing technical support for the industry to establish standardized test framework and reduce risks in real-world road deployment.

arxiv情報

著者 Jingzheng Li,Xianglong Liu,Shikui Wei,Zhijun Chen,Bing Li,Qing Guo,Xianqi Yang,Yanjun Pu,Jiakai Wang
発行日 2025-03-31 04:13:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Towards Benchmarking and Assessing the Safety and Robustness of Autonomous Driving on Safety-critical Scenarios はコメントを受け付けていません

Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions

要約

複雑でマルチモーダルのトラフィックシナリオでスケーラブルなリアルタイムモデル予測制御(MPC)のために設計された階層アーキテクチャを提案します。
このアーキテクチャは、2つの重要なコンポーネントで構成されています。1)ラグランジアンの二重性を使用した周囲の車両との間のMPC予測範囲に沿った関連する相互作用を予測する新しい注意ベースの再発性ニューラルネットワークであるRAID-NET、および2)無気力な衝突回避を排除する確率MPC問題の減少、コンピューティングの衝突の増加、
私たちのアプローチは、インタラクティブな周囲の車両とのシミュレートされた交通交差点で実証されており、モーション計画の問題を解決する際に12倍のスピードアップを示しています。
複数の複雑なトラフィックシナリオで提案されたアーキテクチャを示すビデオは、https://youtu.be/-prionpb9_cにあります。
github:https://github.com/mpc-berkeley/hmpc_raidnet

要約(オリジナル)

We propose a hierarchical architecture designed for scalable real-time Model Predictive Control (MPC) in complex, multi-modal traffic scenarios. This architecture comprises two key components: 1) RAID-Net, a novel attention-based Recurrent Neural Network that predicts relevant interactions along the MPC prediction horizon between the autonomous vehicle and the surrounding vehicles using Lagrangian duality, and 2) a reduced Stochastic MPC problem that eliminates irrelevant collision avoidance constraints, enhancing computational efficiency. Our approach is demonstrated in a simulated traffic intersection with interactive surrounding vehicles, showcasing a 12x speed-up in solving the motion planning problem. A video demonstrating the proposed architecture in multiple complex traffic scenarios can be found here: https://youtu.be/-pRiOnPb9_c. GitHub: https://github.com/MPC-Berkeley/hmpc_raidnet

arxiv情報

著者 Hansung Kim,Siddharth H. Nair,Francesco Borrelli
発行日 2025-03-31 04:38:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions はコメントを受け付けていません

Towards a cognitive architecture to enable natural language interaction in co-constructive task learning

要約

この研究では、認知アーキテクチャが共同建設タスク学習(CCTL)において自然言語の利点を活用する必要がある特徴がある質問に対処します。
コンテキストを提供するために、最初にインタラクティブタスク学習(ITL)、人間の記憶システムのメカニズム、および自然言語とマルチモダリティの重要性について説明します。
次に、認知アーキテクチャの現在の状態を調べ、それらの機能を分析して、複数のソースに基づいたCCTLの概念を通知します。
次に、さまざまな研究ドメインからの洞察を統合して、統一されたフレームワークを開発します。
最後に、ヒトロボット相互作用(HRI)でCCTLを達成するために必要な残りの課題と要件を特定することで結論付けます。

要約(オリジナル)

This research addresses the question, which characteristics a cognitive architecture must have to leverage the benefits of natural language in Co-Constructive Task Learning (CCTL). To provide context, we first discuss Interactive Task Learning (ITL), the mechanisms of the human memory system, and the significance of natural language and multi-modality. Next, we examine the current state of cognitive architectures, analyzing their capabilities to inform a concept of CCTL grounded in multiple sources. We then integrate insights from various research domains to develop a unified framework. Finally, we conclude by identifying the remaining challenges and requirements necessary to achieve CCTL in Human-Robot Interaction (HRI).

arxiv情報

著者 Manuel Scheibl,Birte Richter,Alissa Müller,Michael Beetz,Britta Wrede
発行日 2025-03-31 06:23:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC, cs.RO | Towards a cognitive architecture to enable natural language interaction in co-constructive task learning はコメントを受け付けていません

Trajectory Planning for Automated Driving using Target Funnels

要約

自動運転車は感覚入力に依存して周囲を監視し、最も可能性の高い将来の道路コースに継続的に適応します。
予測軌道計画は、重要な入力として(不確実な)道路コースのスナップショットに基づいています。
ノイズの多い知覚データでは、道路コースの推定値は大きく異なり、優柔不断で不安定なステアリング行動につながります。
この問題を克服するために、このペーパーでは、新しい客観的関数を備えた予測軌跡計画アルゴリズムを紹介します。最も可能性の高い道路コースに基づいて単一の参照軌跡をターゲットにする代わりに、ターゲットファンネルと呼ばれる一連のターゲット参照セットを追跡することを考慮します。
提案された計画アルゴリズムは、道路コースに関する確率的情報を統合し、したがって、道路認識の定期的な更新を暗黙的に考慮します。
私たちのソリューションは、プロトタイプ車両から収集された実際の駆動データを使用して、ケーススタディで評価されます。
結果は、アルゴリズムが追跡精度を維持し、騒々しい道路知覚の存在下で望ましくないステアリングコマンドを大幅に削減し、確実性の同等の定式化と比較して56%の投入コストを削減することを示しています。

要約(オリジナル)

Self-driving vehicles rely on sensory input to monitor their surroundings and continuously adapt to the most likely future road course. Predictive trajectory planning is based on snapshots of the (uncertain) road course as a key input. Under noisy perception data, estimates of the road course can vary significantly, leading to indecisive and erratic steering behavior. To overcome this issue, this paper introduces a predictive trajectory planning algorithm with a novel objective function: instead of targeting a single reference trajectory based on the most likely road course, tracking a series of target reference sets, called a target funnel, is considered. The proposed planning algorithm integrates probabilistic information about the road course, and thus implicitly considers regular updates to road perception. Our solution is assessed in a case study using real driving data collected from a prototype vehicle. The results demonstrate that the algorithm maintains tracking accuracy and substantially reduces undesirable steering commands in the presence of noisy road perception, achieving a 56% reduction in input costs compared to a certainty equivalent formulation.

arxiv情報

著者 Benjamin Bogenberger,Johannes Bürger,Vladislav Nenchev
発行日 2025-03-31 07:15:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Trajectory Planning for Automated Driving using Target Funnels はコメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約

自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの使用を提案します。
世界モデルは、過去の状態と行動を与えられたエージェントの次の状態を予測できるニューラルネットワークです。
トレーニング中に世界モデルを活用することにより、運転ポリシーは、過剰な量のトレーニングデータを必要とせずに共変量シフトを効果的に軽減します。
エンドツーエンドのトレーニング中に、私たちのポリシーは、人間のデモで観察された状態と連携することにより、エラーから回復する方法を学び、実行時にトレーニング分布外の摂動から回復できるようにします。
さらに、マルチビューの相互参加と学習シーンクエリを採用する新しいトランスベースのPerception Encoderを紹介します。
定性的および定量的な結果を提示し、カーラシミュレーターでのクローズドループテストにおける以前の最先端の最新技術に関する大幅な改善を示し、カーラとナヴィディアのドライブSIMの両方で摂動を処理する能力を示しています。

要約(オリジナル)

We propose the use of latent space generative world models to address the covariate shift problem in autonomous driving. A world model is a neural network capable of predicting an agent’s next state given past states and actions. By leveraging a world model during training, the driving policy effectively mitigates covariate shift without requiring an excessive amount of training data. During end-to-end training, our policy learns how to recover from errors by aligning with states observed in human demonstrations, so that at runtime it can recover from perturbations outside the training distribution. Additionally, we introduce a novel transformer-based perception encoder that employs multi-view cross-attention and a learned scene query. We present qualitative and quantitative results, demonstrating significant improvements upon prior state of the art in closed-loop testing in the CARLA simulator, as well as showing the ability to handle perturbations in both CARLA and NVIDIA’s DRIVE Sim.

arxiv情報

著者 Alexander Popov,Alperen Degirmenci,David Wehr,Shashank Hegde,Ryan Oldja,Alexey Kamenev,Bertrand Douillard,David Nistér,Urs Muller,Ruchi Bhargava,Stan Birchfield,Nikolai Smolyanskiy
発行日 2025-03-31 07:26:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models はコメントを受け付けていません

Disambiguate Gripper State in Grasp-Based Tasks: Pseudo-Tactile as Feedback Enables Pure Simulation Learning

要約

把握ベースの操作タスクは、環境と相互作用するロボットの基本ですが、グリッパー状態のあいまいさは、これらのタスクの模倣学習ポリシーの堅牢性を大幅に低下させます。
データ駆動型ソリューションは、現実世界の高いデータコストの課題に直面していますが、シミュレーションデータは、低コストにもかかわらず、SIMからリアルのギャップによって制限されています。
グリッパー状態のあいまいさの根本原因を触覚フィードバックの欠如として特定します。
これに対処するために、触覚センサーとしてフォース制御グリッパーを使用するというアイデアに触発された、フィードバックとして擬似タクタイルを使用する新しいアプローチを提案します。
この方法は、追加のデータ収集とハードウェアの関与なしにポリシーの堅牢性を高め、ポリシーのノイズフリーのバイナリグリッパー状態観測を提供し、シミュレーションの力を解き放つために純粋なシミュレーション学習を促進します。
3つの実際の把握ベースのタスクにわたる実験結果は、アプローチの必要性、有効性、効率性を示しています。

要約(オリジナル)

Grasp-based manipulation tasks are fundamental to robots interacting with their environments, yet gripper state ambiguity significantly reduces the robustness of imitation learning policies for these tasks. Data-driven solutions face the challenge of high real-world data costs, while simulation data, despite its low costs, is limited by the sim-to-real gap. We identify the root cause of gripper state ambiguity as the lack of tactile feedback. To address this, we propose a novel approach employing pseudo-tactile as feedback, inspired by the idea of using a force-controlled gripper as a tactile sensor. This method enhances policy robustness without additional data collection and hardware involvement, while providing a noise-free binary gripper state observation for the policy and thus facilitating pure simulation learning to unleash the power of simulation. Experimental results across three real-world grasp-based tasks demonstrate the necessity, effectiveness, and efficiency of our approach.

arxiv情報

著者 Yifei Yang,Lu Chen,Zherui Song,Yenan Chen,Wentao Sun,Zhongxiang Zhou,Rong Xiong,Yue Wang
発行日 2025-03-31 08:29:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Disambiguate Gripper State in Grasp-Based Tasks: Pseudo-Tactile as Feedback Enables Pure Simulation Learning はコメントを受け付けていません

Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections

要約

信号のない交差点を介した安全で効率的な軌道を計画することは、特に予測不可能な相互作用と紛争の可能性が高まる動的なマルチタスク環境で、自律車(AVS)に重大な課題をもたらします。
この研究の目的は、3つの異なる交差点の動きにわたる安全性と効率性を確保するために、統一された堅牢な適応型フレームワークを開発することにより、これらの課題に対処することを目的としています。
既存の方法は、安全性を確保し、そのような環境でのデモンストレーションからマルチタスクの動作を効果的に学習するために、しばしば苦労しています。
この研究は、動的な高次制御バリア関数(DHOCBF)を、動的安全性批判ディフューザー(DSC-Diffuser)と呼ばれる拡散ベースのモデルと統合する安全性批判的な計画方法を提案します。
DSC-Diffuserは、効率を向上させるためにタスク誘導計画を活用し、実際の専門家デモンストレーションから複数の運転タスクの同時学習を可能にします。
さらに、目標指向の制約を組み込むと、変位エラーが大幅に減少し、正確な軌跡の実行が確保されます。
動的環境での安全性をさらに確保するために、提案されたDHOCBFフレームワークは、周囲の車両の動きを説明するように動的に調整され、従来の制御バリア機能と比較して適応性が向上し、保守主義を減らします。
数値シミュレーションを通じて実施されるDHOCBFの妥当性評価は、障害物の速度、サイズ、不確実性、および場所の変動に適応する際にその堅牢性を示し、幅広い複雑で不確実なシナリオの運転安全性を効果的に維持します。
包括的なパフォーマンス評価は、DSC-Diffuserが現実的で安定した一般化可能なポリシーを生成し、複雑なマルチタスク運転シナリオで柔軟性と信頼できる安全保証を提供することを示しています。

要約(オリジナル)

Planning safe and efficient trajectories through signal-free intersections presents significant challenges for autonomous vehicles (AVs), particularly in dynamic, multi-task environments with unpredictable interactions and an increased possibility of conflicts. This study aims to address these challenges by developing a unified, robust, adaptive framework to ensure safety and efficiency across three distinct intersection movements: left-turn, right-turn, and straight-ahead. Existing methods often struggle to reliably ensure safety and effectively learn multi-task behaviors from demonstrations in such environments. This study proposes a safety-critical planning method that integrates Dynamic High-Order Control Barrier Functions (DHOCBF) with a diffusion-based model, called Dynamic Safety-Critical Diffuser (DSC-Diffuser). The DSC-Diffuser leverages task-guided planning to enhance efficiency, allowing the simultaneous learning of multiple driving tasks from real-world expert demonstrations. Moreover, the incorporation of goal-oriented constraints significantly reduces displacement errors, ensuring precise trajectory execution. To further ensure driving safety in dynamic environments, the proposed DHOCBF framework dynamically adjusts to account for the movements of surrounding vehicles, offering enhanced adaptability and reduce the conservatism compared to traditional control barrier functions. Validity evaluations of DHOCBF, conducted through numerical simulations, demonstrate its robustness in adapting to variations in obstacle velocities, sizes, uncertainties, and locations, effectively maintaining driving safety across a wide range of complex and uncertain scenarios. Comprehensive performance evaluations demonstrate that DSC-Diffuser generates realistic, stable, and generalizable policies, providing flexibility and reliable safety assurance in complex multi-task driving scenarios.

arxiv情報

著者 Di Chen,Ruiguo Zhong,Kehua Chen,Zhiwei Shang,Meixin Zhu,Edward Chung
発行日 2025-03-31 08:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections はコメントを受け付けていません

GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models

要約

マルチロボットシステムの制御ポリシーの開発は、従来、複雑で労働集約的なプロセスに従っており、多くの場合、動的タスクに適応する柔軟性が欠けています。
これにより、制御ポリシーを自動的に作成する方法に関する研究が動機付けられています。
ただし、これらの方法では、手動で客観的機能を作成および改良するための反復プロセスが必要であり、それにより開発サイクルが長くなります。
この作業では、大規模な言語モデルを活用して自然言語の単純なユーザー命令に基づいてマルチロボットタスクの制御ポリシーを自動的に生成および展開するエンドツーエンドシステムである\ textit {genswarm}を導入します。
多言語のエージェントシステムとして、Genswarmはゼロショット学習を達成し、変更または目に見えないタスクに迅速に適応できるようにします。
コードポリシーのホワイトボックスの性質により、強い再現性と解釈可能性が保証されます。
スケーラブルなソフトウェアとハ​​ードウェアアーキテクチャにより、Genswarmは、シミュレートされたマルチロボットシステムと実世界の両方のマルチロボットシステムの効率的なポリシー展開をサポートし、ロボット工学の専門家と非専門家にとって価値があることを証明できるエンドツーエンドの機能を実現します。

要約(オリジナル)

The development of control policies for multi-robot systems traditionally follows a complex and labor-intensive process, often lacking the flexibility to adapt to dynamic tasks. This has motivated research on methods to automatically create control policies. However, these methods require iterative processes of manually crafting and refining objective functions, thereby prolonging the development cycle. This work introduces \textit{GenSwarm}, an end-to-end system that leverages large language models to automatically generate and deploy control policies for multi-robot tasks based on simple user instructions in natural language. As a multi-language-agent system, GenSwarm achieves zero-shot learning, enabling rapid adaptation to altered or unseen tasks. The white-box nature of the code policies ensures strong reproducibility and interpretability. With its scalable software and hardware architectures, GenSwarm supports efficient policy deployment on both simulated and real-world multi-robot systems, realizing an instruction-to-execution end-to-end functionality that could prove valuable for robotics specialists and non-specialists alike.The code of the proposed GenSwarm system is available online: https://github.com/WindyLab/GenSwarm.

arxiv情報

著者 Wenkang Ji,Huaben Chen,Mingyang Chen,Guobin Zhu,Lufeng Xu,Roderich Groß,Rui Zhou,Ming Cao,Shiyu Zhao
発行日 2025-03-31 09:26:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, cs.RO | GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models はコメントを受け付けていません