Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects

要約

さまざまなジオメトリと変形可能なオブジェクトを備えたオブジェクトを操作することは、ロボット工学の大きな課題です。
異なるオブジェクトや布吊り下げの挿入などのタスクには、正確な制御と複雑なダイナミクスの効果的なモデリングが必要です。
この作業では、この問題を、アクチュエーターやオブジェクトなどの小さなサブグラフを含む不均一なグラフのレンズを通して、相互作用を説明するさまざまなエッジタイプを伴います。
このグラフ表現は、剛性と変形可能なオブジェクトの両方のタスクの統一された構造として機能し、複数のアクチュエーターを含むタスクにさらに拡張できます。
このセットアップを評価するために、多様なオブジェクトの剛性挿入、複数のエンド効果によるロープと布の操作など、斬新で挑戦的な強化学習ベンチマークを提示します。
これらのタスクは、初期構成とターゲット構成の両方が3Dスペースで均一にサンプリングされるため、大きな検索スペースを提示します。
この問題に対処するために、幾何学的対称性を活用するための主要なバックボーンとして$ se(3)$ equivariantメッセージパスネットワークを利用して、不均一等量ポリシー(HEPI)と呼ばれる新しいグラフベースのポリシーモデルを提案します。
さらに、明示的な不均一性をモデル化することにより、HEPIは、平均リターン、サンプル効率、および目に見えないオブジェクトへの一般化に関して、変圧器ベースおよび非氷河の等縁ポリシーを上回ることができます。

要約(オリジナル)

Manipulating objects with varying geometries and deformable objects is a major challenge in robotics. Tasks such as insertion with different objects or cloth hanging require precise control and effective modelling of complex dynamics. In this work, we frame this problem through the lens of a heterogeneous graph that comprises smaller sub-graphs, such as actuators and objects, accompanied by different edge types describing their interactions. This graph representation serves as a unified structure for both rigid and deformable objects tasks, and can be extended further to tasks comprising multiple actuators. To evaluate this setup, we present a novel and challenging reinforcement learning benchmark, including rigid insertion of diverse objects, as well as rope and cloth manipulation with multiple end-effectors. These tasks present a large search space, as both the initial and target configurations are uniformly sampled in 3D space. To address this issue, we propose a novel graph-based policy model, dubbed Heterogeneous Equivariant Policy (HEPi), utilizing $SE(3)$ equivariant message passing networks as the main backbone to exploit the geometric symmetry. In addition, by modeling explicit heterogeneity, HEPi can outperform Transformer-based and non-heterogeneous equivariant policies in terms of average returns, sample efficiency, and generalization to unseen objects.

arxiv情報

著者 Tai Hoang,Huy Le,Philipp Becker,Vien Anh Ngo,Gerhard Neumann
発行日 2025-02-10 20:10:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects はコメントを受け付けていません

Centralization vs. decentralization in multi-robot sweep coverage with ground robots and UAVs

要約

Swarm Roboticsでは、分散型制御が、集中制御のよりスケーラブルで断層耐性の代替品として提案されることがよくあります。
ただし、集中型の動作は、分散型の対応物よりも速く、効率的であることがよくあります。
特定のアプリケーションでは、解決されるタスクの目標と制約は、集中制御、分散型制御、または2つの組み合わせを使用する選択を導く必要があります。
現在、集中化と分散化の間に存在する正確なトレードオフは、十分に定義されていません。
このホワイトペーパーでは、5つの異なるタイプのマルチロボット制御構造にわたるスイープカバレッジの例タスクにおける集中化と分散化との比較パフォーマンス評価を研究します:ランダムウォーク、ビーコンで分散化され、自己組織化階層を使用したハイブリッド形成制御、集中型形成
コントロール、および事前に決定されました。
5つのアプローチすべてで、カバレッジタスクは地上ロボットのグループによって完了します。
ランダムウォークを除き、各アプローチでは、地上ロボットはUAVに支援され、監督者またはビーコンとして機能します。
集中化されたアプローチが有利になると予想される3つのパフォーマンスメトリックの観点からアプローチを比較します – カバレッジの完全性、カバレッジの均一性、スイープ完了時間 – と、分散化されたアプローチに利点があると予想される2つのメトリック – スケーラビリティ
(4、8、または16の地上ロボット)および断層トレランス(0%、25%、50%、または75%の地上ロボット障害)。
最後に、1つのシステムで両方の利点を組み合わせることに関する将来の作業について説明します。

要約(オリジナル)

In swarm robotics, decentralized control is often proposed as a more scalable and fault-tolerant alternative to centralized control. However, centralized behaviors are often faster and more efficient than their decentralized counterparts. In any given application, the goals and constraints of the task being solved should guide the choice to use centralized control, decentralized control, or a combination of the two. Currently, the exact trade-offs that exist between centralization and decentralization are not well defined. In this paper, we study comparative performance assessment between centralization and decentralization in the example task of sweep coverage, across five different types of multi-robot control structures: random walk, decentralized with beacons, hybrid formation control using self-organizing hierarchy, centralized formation control, and predetermined. In all five approaches, the coverage task is completed by a group of ground robots. In each approach, except for the random walk, the ground robots are assisted by UAVs, acting as supervisors or beacons. We compare the approaches in terms of three performance metrics for which centralized approaches are expected to have an advantage — coverage completeness, coverage uniformity, and sweep completion time — and two metrics for which decentralized approaches are expected to have an advantage — scalability (4, 8, or 16 ground robots) and fault tolerance (0%, 25%, 50%, or 75% ground robot failure). Finally, we discuss future work on combining the advantages of both in one system.

arxiv情報

著者 Aryo Jamshidpey,Mostafa Wahby,Michael Allwright,Weixu Zhu,Marco Dorigo,Mary Katherine Heinrich
発行日 2025-02-10 22:56:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Centralization vs. decentralization in multi-robot sweep coverage with ground robots and UAVs はコメントを受け付けていません

Large Language Models for Multi-Robot Systems: A Survey

要約

大規模な言語モデル(LLMS)の迅速な進歩により、マルチロボットシステム(MRS)に新しい可能性が開かれ、コミュニケーション、タスク計画、および人間とロボットの相互作用が強化されました。
従来のシングルロボットおよびマルチエージェントシステムとは異なり、MRSは、調整、スケーラビリティ、実際の適応性など、独自の課題を提起します。
この調査では、MRSへのLLM統合の最初の包括的な調査を提供します。
高レベルのタスク割り当て、ミッドレベルのモーション計画、低レベルのアクション生成、および人間の介入におけるアプリケーションを体系的に分類します。
家庭用ロボット工学、建設、フォーメーション制御、ターゲット追跡、ロボットゲームなど、多様なドメインの主要なアプリケーションを強調し、MRSのLLMSの汎用性と変革の可能性を紹介します。
さらに、数学的な推論の制限、幻覚、潜伏期の問題、堅牢なベンチマークシステムの必要性など、MRSのLLMの適応を制限する課題を調べます。
最後に、将来の研究の機会を概説し、微調整、推論技術、およびタスク固有のモデルの進歩を強調します。
この調査の目的は、LLMSが搭載したMRSのインテリジェンスと現実世界の展開において研究者を導くことを目的としています。
この分野での研究の急速に進化する性質に基づいて、オープンソースのGitHubリポジトリの論文を更新し続けています。

要約(オリジナル)

The rapid advancement of Large Language Models (LLMs) has opened new possibilities in Multi-Robot Systems (MRS), enabling enhanced communication, task planning, and human-robot interaction. Unlike traditional single-robot and multi-agent systems, MRS poses unique challenges, including coordination, scalability, and real-world adaptability. This survey provides the first comprehensive exploration of LLM integration into MRS. It systematically categorizes their applications across high-level task allocation, mid-level motion planning, low-level action generation, and human intervention. We highlight key applications in diverse domains, such as household robotics, construction, formation control, target tracking, and robot games, showcasing the versatility and transformative potential of LLMs in MRS. Furthermore, we examine the challenges that limit adapting LLMs in MRS, including mathematical reasoning limitations, hallucination, latency issues, and the need for robust benchmarking systems. Finally, we outline opportunities for future research, emphasizing advancements in fine-tuning, reasoning techniques, and task-specific models. This survey aims to guide researchers in the intelligence and real-world deployment of MRS powered by LLMs. Based on the fast-evolving nature of research in the field, we keep updating the papers in the open-source Github repository.

arxiv情報

著者 Peihan Li,Zijian An,Shams Abrar,Lifeng Zhou
発行日 2025-02-10 23:37:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Large Language Models for Multi-Robot Systems: A Survey はコメントを受け付けていません

Cross-platform Learning-based Fault Tolerant Surfacing Controller for Underwater Robots

要約

この論文では、補強学習(RL)に基づいて、水中ロボット用の新しいクロスプラットフォーム断層耐性サーフェシングコントローラーを提案します。
誤動作するアクチュエーターの明示的な識別を必要とする従来のアプローチとは異なり、我々の方法により、障害を特定する必要なく、残りの運用アクチュエーターのみを使用してロボットを表面化できます。
提案されたコントローラーは、さまざまなアクチュエータ構成で多様な障害シナリオを処理できる堅牢なポリシーを学習します。
さらに、さまざまなアクチュエーターを使用して、さまざまな水中ロボット全体で制御ポリシーの一部を共有する転送学習メカニズムを導入し、プラットフォーム全体で学習効率と一般化を改善します。
アプローチを検証するために、ホバリングタイプのAUV、魚雷型のAUV、およびタートル型のロボット(U-CAT)の3つの異なるタイプの水中ロボットでシミュレーションを実施します。
さらに、実世界の実験が実行され、制御された環境で学習ポリシーをシミュレーションから物理Uキャットに正常に転送します。
RLベースのコントローラーは、ベースラインコントローラーと比較して安定性と成功率の観点から優れたパフォーマンスを示し、ベースラインコントローラーの57.1%と比較して、実際のテストで85.7%の成功率を達成しています。
この研究は、現実世界の水生ミッションでの潜在的なアプリケーションを備えた、多様な水中プラットフォームのための断層耐性制御のためのスケーラブルで効率的なソリューションを提供します。

要約(オリジナル)

In this paper, we propose a novel cross-platform fault-tolerant surfacing controller for underwater robots, based on reinforcement learning (RL). Unlike conventional approaches, which require explicit identification of malfunctioning actuators, our method allows the robot to surface using only the remaining operational actuators without needing to pinpoint the failures. The proposed controller learns a robust policy capable of handling diverse failure scenarios across different actuator configurations. Moreover, we introduce a transfer learning mechanism that shares a part of the control policy across various underwater robots with different actuators, thus improving learning efficiency and generalization across platforms. To validate our approach, we conduct simulations on three different types of underwater robots: a hovering-type AUV, a torpedo shaped AUV, and a turtle-shaped robot (U-CAT). Additionally, real-world experiments are performed, successfully transferring the learned policy from simulation to a physical U-CAT in a controlled environment. Our RL-based controller demonstrates superior performance in terms of stability and success rate compared to a baseline controller, achieving an 85.7 percent success rate in real-world tests compared to 57.1 percent with a baseline controller. This research provides a scalable and efficient solution for fault-tolerant control for diverse underwater platforms, with potential applications in real-world aquatic missions.

arxiv情報

著者 Yuya Hamamatsu,Walid Remmas,Jaan Rebane,Maarja Kruusmaa,Asko Ristolainen
発行日 2025-02-10 23:50:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Cross-platform Learning-based Fault Tolerant Surfacing Controller for Underwater Robots はコメントを受け付けていません

A Safe Hybrid Control Framework for Car-like Robot with Guaranteed Global Path-Invariance using a Control Barrier Function

要約

この作業は、障害物の回避、グローバルな収束、安全性を備えた車のようなロボットのハイブリッドフレームワークを提案します。安全性はパスの不変性と解釈されます。つまり、ロボットがパスに収束すると、パスを離れることはありません。
障害物がパスの周りにあることができるアプリオリの障害のない実行可能なパスを考えると、タスクは、パスに到達してから障害物を避けてから、それを離れることなくパスにとどまることです。
問題は2つの段階で解決されます。
まず、パスに沿って「タイトな」障害のない近隣を定義し、ローカルコントローラーを設計して、パスとパスの不変性への収束を確保します。
制御バリア機能技術は、ローカルパス不変コントローラーが定義されていない特異点ポイントからシステムを遠ざけるための制御設計に関与しています。
第二に、このローカルパス不変コントローラーをパス不変性保証なしの既存の文献からグローバル追跡コントローラーと統合するハイブリッドコントロールフレームワークを設計し、任意の位置から目的のパス、つまりグローバル収束に収束を保証します。
このフレームワークは、パスの不変性とセンサーノイズへの堅牢性を保証します。
詳細なシミュレーション結果は、提案されたスキームの有効性を確認します。

要約(オリジナル)

This work proposes a hybrid framework for car-like robots with obstacle avoidance, global convergence, and safety, where safety is interpreted as path invariance, namely, once the robot converges to the path, it never leaves the path. Given a priori obstacle-free feasible path where obstacles can be around the path, the task is to avoid obstacles while reaching the path and then staying on the path without leaving it. The problem is solved in two stages. Firstly, we define a “tight” obstacle-free neighborhood along the path and design a local controller to ensure convergence to the path and path invariance. The control barrier function technology is involved in the control design to steer the system away from its singularity points, where the local path invariant controller is not defined. Secondly, we design a hybrid control framework that integrates this local path-invariant controller with any global tracking controller from the existing literature without path invariance guarantee, ensuring convergence from any position to the desired path, namely, global convergence. This framework guarantees path invariance and robustness to sensor noise. Detailed simulation results affirm the effectiveness of the proposed scheme.

arxiv情報

著者 Nan Wang,Adeel Akhtar,Ricardo G. Sanfelice
発行日 2025-02-11 00:06:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | A Safe Hybrid Control Framework for Car-like Robot with Guaranteed Global Path-Invariance using a Control Barrier Function はコメントを受け付けていません

Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs

要約

Vision and-Language Navigation(VLN)タスクでは、3D環境をナビゲートするためにテキストの指示に従うエージェントが必要です。
従来のアプローチでは、ドメイン固有のデータセットに大きく依存してVLNモデルをトレーニングするために、監視された学習方法を使用しています。
最近の方法では、GPT-4などのクローズドソースの大型言語モデル(LLM)を利用して、ゼロショットマナーでVLNタスクを解決しますが、実際のアプリケーションでの高価なトークンコストと潜在的なデータ侵害に関連する課題に直面しています。
この作業では、連続環境でゼロショットVLNのオープンソースLLMSを調査する新しい研究であるOpen-Navを紹介します。
Open-Navは、空間的な時代の考え方(COT)の推論アプローチを採用して、タスクを命令理解、進捗の推定、意思決定に分解します。
ナビゲーションにおけるLLMの推論を改善するために、きめ細かいオブジェクトと空間知識を使用してシーンの認識を高めます。
シミュレートされた環境と現実世界の両方の環境での当社の広範な実験は、open-navがクローズドソースLLMを使用するのと比較して競争力のあるパフォーマンスを達成することを示しています。

要約(オリジナル)

Vision-and-Language Navigation (VLN) tasks require an agent to follow textual instructions to navigate through 3D environments. Traditional approaches use supervised learning methods, relying heavily on domain-specific datasets to train VLN models. Recent methods try to utilize closed-source large language models (LLMs) like GPT-4 to solve VLN tasks in zero-shot manners, but face challenges related to expensive token costs and potential data breaches in real-world applications. In this work, we introduce Open-Nav, a novel study that explores open-source LLMs for zero-shot VLN in the continuous environment. Open-Nav employs a spatial-temporal chain-of-thought (CoT) reasoning approach to break down tasks into instruction comprehension, progress estimation, and decision-making. It enhances scene perceptions with fine-grained object and spatial knowledge to improve LLM’s reasoning in navigation. Our extensive experiments in both simulated and real-world environments demonstrate that Open-Nav achieves competitive performance compared to using closed-source LLMs.

arxiv情報

著者 Yanyuan Qiao,Wenqi Lyu,Hui Wang,Zixu Wang,Zerui Li,Yuan Zhang,Mingkui Tan,Qi Wu
発行日 2025-02-11 00:55:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs はコメントを受け付けていません

Online Aggregation of Trajectory Predictors

要約

軌道の予測、過去のデータから将来のエージェントの行動を予測するタスクは、中心から安全で効率的な自律運転です。
多様な一連のメソッド(例:ルールベースまたは異なるアーキテクチャとデータセットで学習)が提案されていますが、これらのメソッドのパフォーマンスが展開環境に敏感であることがよくあります(例えば、設計ルールモデルのうまくいかない
環境、またはテストデータがトレーニングデータとどれだけ正確に一致するか)。
オンラインの凸の最適化の原則的な理論に基づいて、凸性と定常性を超えて、さまざまな軌道予測因子をオンラインで集約するための軽量でモデルと存在する方法を提示します。
個々の軌道予測因子を「専門家」として扱い、さまざまな専門家の出力を混合する確率ベクトルを維持することを提案します。
次に、主要な技術的アプローチは、オンラインデータを活用することにあります – 次のタイムステップで明らかにされる真のエージェントの動作 – は、勾配が最適なベクトルを選択するために確率ベクトルを導く凸型または非繊細な損失関数を形成します。
専門家の混合。
この方法をインスタンス化して、ヌスセンデータセットのさまざまな都市で訓練された軌道予測因子を集約し、配布外のLYFTデータセットに展開した場合でも、特異モデルよりも優れていても、同様に機能することを示します。

要約(オリジナル)

Trajectory prediction, the task of forecasting future agent behavior from past data, is central to safe and efficient autonomous driving. A diverse set of methods (e.g., rule-based or learned with different architectures and datasets) have been proposed, yet it is often the case that the performance of these methods is sensitive to the deployment environment (e.g., how well the design rules model the environment, or how accurately the test data match the training data). Building upon the principled theory of online convex optimization but also going beyond convexity and stationarity, we present a lightweight and model-agnostic method to aggregate different trajectory predictors online. We propose treating each individual trajectory predictor as an ‘expert’ and maintaining a probability vector to mix the outputs of different experts. Then, the key technical approach lies in leveraging online data -the true agent behavior to be revealed at the next timestep- to form a convex-or-nonconvex, stationary-or-dynamic loss function whose gradient steers the probability vector towards choosing the best mixture of experts. We instantiate this method to aggregate trajectory predictors trained on different cities in the NUSCENES dataset and show that it performs just as well, if not better than, any singular model, even when deployed on the out-of-distribution LYFT dataset.

arxiv情報

著者 Alex Tong,Apoorva Sharma,Sushant Veer,Marco Pavone,Heng Yang
発行日 2025-02-11 02:01:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Online Aggregation of Trajectory Predictors はコメントを受け付けていません

Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired

要約

盲導犬ロボットは、視覚障害のある個人のモビリティと安全性を高めるための有望なソリューションを提供し、特に知覚とコミュニケーションにおいて、伝統的な盲導犬の限界に対処します。
ビジョン言語モデル(VLM)の出現により、ロボットは周囲の自然言語の説明を生成し、より安全な意思決定を支援することができます。
ただし、既存のVLMは、空間的関係を正確に解釈して伝えるのに苦労しています。これは、街路交差点などの複雑な環境でのナビゲーションに重要です。
スペースアウェア命令チューニング(SAIT)データセットとスペースアウェアベンチマーク(SAベンチ)を紹介して、物理的環境を理解する際の現在のVLMの制限に対処します。
自動化されたデータ生成パイプラインは、3Dスペースと周囲の目的地への仮想パスに焦点を当てており、環境理解を高め、VLMが視覚障害のある個人により正確なガイダンスを提供できるようにします。
また、ウォーキングガイダンスの提供におけるVLMの有効性を評価するための評価プロトコルも提案します。
比較実験は、私たちの宇宙認識命令チューニングモデルが最先端のアルゴリズムよりも優れていることを示しています。
https://github.com/byungokhan/space-awarevlmで、関連コードとともにSAITデータセットとSAベンチを完全にオープンソースしました。

要約(オリジナル)

Guide dog robots offer promising solutions to enhance mobility and safety for visually impaired individuals, addressing the limitations of traditional guide dogs, particularly in perceptual intelligence and communication. With the emergence of Vision-Language Models (VLMs), robots are now capable of generating natural language descriptions of their surroundings, aiding in safer decision-making. However, existing VLMs often struggle to accurately interpret and convey spatial relationships, which is crucial for navigation in complex environments such as street crossings. We introduce the Space-Aware Instruction Tuning (SAIT) dataset and the Space-Aware Benchmark (SA-Bench) to address the limitations of current VLMs in understanding physical environments. Our automated data generation pipeline focuses on the virtual path to the destination in 3D space and the surroundings, enhancing environmental comprehension and enabling VLMs to provide more accurate guidance to visually impaired individuals. We also propose an evaluation protocol to assess VLM effectiveness in delivering walking guidance. Comparative experiments demonstrate that our space-aware instruction-tuned model outperforms state-of-the-art algorithms. We have fully open-sourced the SAIT dataset and SA-Bench, along with the related code, at https://github.com/byungokhan/Space-awareVLM

arxiv情報

著者 ByungOk Han,Woo-han Yun,Beom-Su Seo,Jaehong Kim
発行日 2025-02-11 02:14:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired はコメントを受け付けていません

Parameter Optimization of Optical Six-Axis Force/Torque Sensor for Legged Robots

要約

このペーパーでは、コンパクトで軽量の脚のあるロボットに合わせた新しい6軸力/トルクセンサーを紹介します。
従来のひずみゲージベースのセンサーとは異なり、提案されている非接触設計はフォトカプラーを採用し、物理的影響に対する耐性を高め、損傷リスクを軽減します。
このアプローチは、製造を簡素化し、コストを削減し、小さなサイズ、軽量、幅広い力の測定範囲を組み合わせることにより、脚のロボットの需要を満たします。
センサーパラメーターを最適化するための方法も提示され、感度の最大化とエラーの最小化に焦点を当てています。
目的関数の正確なモデリングと分析により、最適な設計パラメーターの導出が可能になりました。
センサーのパフォーマンスは、広範なテストと四足ロボットへの統合を通じて検証され、理論モデリングとの整合性を示しました。
センサーの正確な測定機能により、特にロボットの足と地面との相互作用の分析において、多様なロボット環境に適しています。
このイノベーションは、ロボット工学とセンサー技術の進歩に貢献しながら、既存のセンサーの制限に対処し、ロボットシステムの将来のアプリケーションへの道を開いています。

要約(オリジナル)

This paper introduces a novel six-axis force/torque sensor tailored for compact and lightweight legged robots. Unlike traditional strain gauge-based sensors, the proposed non-contact design employs photocouplers, enhancing resistance to physical impacts and reducing damage risk. This approach simplifies manufacturing, lowers costs, and meets the demands of legged robots by combining small size, light weight, and a wide force measurement range. A methodology for optimizing sensor parameters is also presented, focusing on maximizing sensitivity and minimizing error. Precise modeling and analysis of objective functions enabled the derivation of optimal design parameters. The sensor’s performance was validated through extensive testing and integration into quadruped robots, demonstrating alignment with theoretical modeling. The sensor’s precise measurement capabilities make it suitable for diverse robotic environments, particularly in analyzing interactions between robot feet and the ground. This innovation addresses existing sensor limitations while contributing to advancements in robotics and sensor technology, paving the way for future applications in robotic systems.

arxiv情報

著者 Hyun-Bin Kim,Byeong-Il Ham,Keun-Ha Choi,Kyung-Soo Kim
発行日 2025-02-11 02:39:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Parameter Optimization of Optical Six-Axis Force/Torque Sensor for Legged Robots はコメントを受け付けていません

VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play

要約

マルチエージェント補強学習(MARL)は、制御されているが挑戦的なシナリオでのアルゴリズムの体系的な評価を可能にする専門的なテストベッドの開発によって大幅に促進されています。
ただし、既存のテストベッドは、多くの場合、純粋に仮想シミュレーションまたはロボットアーム、四足動物、ヒューマノイドなどの限られたロボットの形態に焦点を当てており、ドローンのような現実世界の物理的制約を備えた高モビリティプラットフォームを残します。
このギャップを埋めるために、複数のドローンが協力し、物理的なダイナミクスの下でバレーボールのスポーツで競争する新しいMarlテストベッドであるバレーボットを紹介します。
バレーボットは、バレーボールルールの下でターンベースの相互作用モデル、モーションコントロールと戦略的プレイを組み合わせた階層的な意思決定プロセス、シームレスなSIMからリアルへの転送のための高忠実度シミュレーションを特徴としています。
シングルドローンドリルからマルチドローン協同組合および競争の激しいタスクに至るまでの包括的なタスクを提供し、Marl代表とゲーム理論アルゴリズムのベースライン評価を伴います。
シミュレーションの結果では、既存のアルゴリズムは単純なタスクを効果的に処理しますが、低レベルの制御と高レベルの戦略の両方を必要とする複雑なタスクで困難に遭遇することが示されています。
さらに、シミュレーションを学んだポリシーのゼロショット展開を実際のドローンに示し、アジャイルロボットプラットフォームを含むMARL研究を推進するバレーボットの可能性を強調しています。
プロジェクトページはhttps://sites.google.com/view/thu-volleybots/homeにあります。

要約(オリジナル)

Multi-agent reinforcement learning (MARL) has made significant progress, largely fueled by the development of specialized testbeds that enable systematic evaluation of algorithms in controlled yet challenging scenarios. However, existing testbeds often focus on purely virtual simulations or limited robot morphologies such as robotic arms, quadrupeds, and humanoids, leaving high-mobility platforms with real-world physical constraints like drones underexplored. To bridge this gap, we present VolleyBots, a new MARL testbed where multiple drones cooperate and compete in the sport of volleyball under physical dynamics. VolleyBots features a turn-based interaction model under volleyball rules, a hierarchical decision-making process that combines motion control and strategic play, and a high-fidelity simulation for seamless sim-to-real transfer. We provide a comprehensive suite of tasks ranging from single-drone drills to multi-drone cooperative and competitive tasks, accompanied by baseline evaluations of representative MARL and game-theoretic algorithms. Results in simulation show that while existing algorithms handle simple tasks effectively, they encounter difficulty in complex tasks that require both low-level control and high-level strategy. We further demonstrate zero-shot deployment of a simulation-learned policy to real-world drones, highlighting VolleyBots’ potential to propel MARL research involving agile robotic platforms. The project page is at https://sites.google.com/view/thu-volleybots/home.

arxiv情報

著者 Zelai Xu,Chao Yu,Ruize Zhang,Huining Yuan,Xiangmin Yi,Shilong Ji,Chuqi Wang,Wenhao Tang,Yu Wang
発行日 2025-02-11 03:00:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play はコメントを受け付けていません