Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games

要約

強化学習(RL)ベースのモーション計画により、自律的なナビゲーションからロボット操作まで、従来のアプローチを上回る可能性があることが最近示されました。
この作業では、部分的に観察可能なマルチエージェント敵対的な追跡式ゲーム(PEG)における回避ターゲットのモーション計画タスクに焦点を当てています。
追求標識の問題は、検索救助操作や監視ロボットなど、さまざまなアプリケーションに関連しています。ロボットは、検出またはキャプチャを避けながら、インテリジェンスを収集したり、ミッションタスクを達成したりするためのアクションを効果的に計画する必要があります。
高レベルの拡散モデルを統合して環境データに対応するグローバルパスを計画する階層アーキテクチャを提案しますが、低レベルのRLポリシーは回避とグローバルのパスフォローの動作に関する理由です。
さまざまなドメインとさまざまな観測可能性にわたるベンチマークの結果は、私たちのアプローチが検出および目標到達率で77.18%と47.38%を上回ることを示しており、平均でパフォーマンススコアが51.4%増加します。
さらに、この方法は、学習ポリシーの解釈可能性、柔軟性、効率を向上させます。

要約(オリジナル)

Reinforcement Learning (RL)-based motion planning has recently shown the potential to outperform traditional approaches from autonomous navigation to robot manipulation. In this work, we focus on a motion planning task for an evasive target in a partially observable multi-agent adversarial pursuit-evasion game (PEG). Pursuit-evasion problems are relevant to various applications, such as search and rescue operations and surveillance robots, where robots must effectively plan their actions to gather intelligence or accomplish mission tasks while avoiding detection or capture. We propose a hierarchical architecture that integrates a high-level diffusion model to plan global paths responsive to environment data, while a low-level RL policy reasons about evasive versus global path-following behavior. The benchmark results across different domains and different observability show that our approach outperforms baselines by 77.18% and 47.38% on detection and goal reaching rate, which leads to 51.4% increasing of the performance score on average. Additionally, our method improves interpretability, flexibility and efficiency of the learned policy.

arxiv情報

著者 Zixuan Wu,Sean Ye,Manisha Natarajan,Matthew C. Gombolay
発行日 2025-05-08 21:52:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO | Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games はコメントを受け付けていません

Learning Wheelchair Tennis Navigation from Broadcast Videos with Domain Knowledge Transfer and Diffusion Motion Planning

要約

このペーパーでは、専門家のスポーツナビゲーション戦略をWebビデオから敵対的な制約と分散型画像の軌跡を備えたロボットシステムに蒸留する、斬新で一般化可能なゼロショットの知識転送フレームワークを提案します。
パイプラインは、複数の部分ビューから完全な3Dタスクスペースを再構築し、2Dイメージスペースにゆがめ、この2Dスペース内の計画ループを閉じ、関心のある動きをタスクスペースに転送することにより、拡散ベースの模倣学習を可能にします。
さらに、学習ポリシーがポジションコントロールと併せてローカルプランナーとして機能することを実証します。
車椅子のテニスナビゲーション問題にこのフレームワークを適用して、車椅子をボールヒッティング領域に導きます。
当社のパイプラインは、物理的なロボット車椅子で現実世界の記録されたテニスボール軌道に到達する際に97.67%のナビゲーション成功率を達成し、フルサイズのテニスコートでの実際のリアルタイムの実験で68.49%の成功率を達成します。

要約(オリジナル)

In this paper, we propose a novel and generalizable zero-shot knowledge transfer framework that distills expert sports navigation strategies from web videos into robotic systems with adversarial constraints and out-of-distribution image trajectories. Our pipeline enables diffusion-based imitation learning by reconstructing the full 3D task space from multiple partial views, warping it into 2D image space, closing the planning loop within this 2D space, and transfer constrained motion of interest back to task space. Additionally, we demonstrate that the learned policy can serve as a local planner in conjunction with position control. We apply this framework in the wheelchair tennis navigation problem to guide the wheelchair into the ball-hitting region. Our pipeline achieves a navigation success rate of 97.67% in reaching real-world recorded tennis ball trajectories with a physical robot wheelchair, and achieve a success rate of 68.49% in a real-world, real-time experiment on a full-sized tennis court.

arxiv情報

著者 Zixuan Wu,Zulfiqar Zaidi,Adithya Patil,Qingyu Xiao,Matthew Gombolay
発行日 2025-05-08 22:38:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning Wheelchair Tennis Navigation from Broadcast Videos with Domain Knowledge Transfer and Diffusion Motion Planning はコメントを受け付けていません

Zippy: The smallest power-autonomous bipedal robot

要約

小型の脚のロボットプラットフォームは、そのサイズのアクチュエーターの数、電力密度、および精度を制約するハードウェアの制限のために困難です。
任意のスケールでの準パッシブウォーキングロボットの設計原則を活用することにより、単純なメカニズムとオープンループ制御で安定した移動とステアリングを実現できます。
ここでは、高さがわずか3.6 cmの最小の自己完結型の二足歩行ロボットである「ジッピー」の設計と制御を紹介します。
Zippyは、フィードバック制御のない単一のモーターである足を丸くしており、順番、スキップし、昇順のステップができます。
最速のペースで、ロボットは25 cm/sの前方の歩行速度を達成します。これは1秒あたり10脚の長さで、そのメトリックであらゆるサイズの最速の二重型ロボットです。
この作業では、ロボットの設計とパフォーマンスを探索し、より大きなスケールで同様の動的なウォーキングロボットと比較します。

要約(オリジナル)

Miniaturizing legged robot platforms is challenging due to hardware limitations that constrain the number, power density, and precision of actuators at that size. By leveraging design principles of quasi-passive walking robots at any scale, stable locomotion and steering can be achieved with simple mechanisms and open-loop control. Here, we present the design and control of ‘Zippy’, the smallest self-contained bipedal walking robot at only 3.6 cm tall. Zippy has rounded feet, a single motor without feedback control, and is capable of turning, skipping, and ascending steps. At its fastest pace, the robot achieves a forward walking speed of 25 cm/s, which is 10 leg lengths per second, the fastest biped robot of any size by that metric. This work explores the design and performance of the robot and compares it to similar dynamic walking robots at larger scales.

arxiv情報

著者 Steven Man,Soma Narita,Josef Macera,Naomi Oke,Aaron M. Johnson,Sarah Bergbreiter
発行日 2025-05-08 23:13:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Zippy: The smallest power-autonomous bipedal robot はコメントを受け付けていません

Open-Source, Cost-Aware Kinematically Feasible Planning for Mobile and Surface Robotics

要約

多様なロボットプラットフォーム全体で運動的に実行可能なパス計画の重要なニーズに対処する、公然と利用可能な検索ベースの計画フレームワークであるSMACプランナーを紹介します。
SMACプランナーは、Ackermann、Legged、およびその他の大きな非円形ロボット用に展開できるコスト認識A*、Hybrid-A*、および州の格子プランナーの高性能実装を提供します。
私たちのフレームワークは、運動学的実現可能性の制約を維持しながら、モバイルロボット工学に共通する複雑な環境でのパフォーマンスを大幅に改善する新しい「コストアウェア」バリエーションを紹介します。
人気のあるROS 2ナビゲーションスタック内の標準計画システムとして統合されたNAV2、SMACプランナーは、学術研究、商業アプリケーション、およびフィールド展開全体に世界中の何千ものロボットを強化しています。

要約(オリジナル)

We present Smac Planner, an openly available, search-based planning framework that addresses the critical need for kinematically feasible path planning across diverse robot platforms. Smac Planner provides high-performance implementations of Cost-Aware A*, Hybrid-A*, and State Lattice planners that can be deployed for Ackermann, legged, and other large non-circular robots. Our framework introduces novel ‘Cost-Aware’ variations that significantly improve performance in complex environments common to mobile robotics while maintaining kinematic feasibility constraints. Integrated as the standard planning system within the popular ROS 2 Navigation stack, Nav2, Smac Planner now powers thousands of robots worldwide across academic research, commercial applications, and field deployments.

arxiv情報

著者 Steve Macenski,Matthew Booker,Joshua Wallace,Tobias Fischer
発行日 2025-05-08 23:31:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Open-Source, Cost-Aware Kinematically Feasible Planning for Mobile and Surface Robotics はコメントを受け付けていません

Physics-informed Temporal Difference Metric Learning for Robot Motion Planning

要約

モーション計画の問題には、ロボットの開始からターゲット構成までの衝突のないパスを見つけることが含まれます。
最近、高価な専門家のデモンストレーションを必要とせずに、モーション計画の問題に取り組むために、自己監督の学習方法が現れました。
それらは、ニューラルネットワークをトレーニングするためのエイコナル方程式を解き、効率的なソリューションにつながります。
ただし、これらの方法は、最適な値関数や測地線距離など、エイコナル方程式の重要な特性を維持できないため、複雑な環境で苦労しています。
これらの制限を克服するために、エイコン方程式をより正確に解決し、複雑で目に見えない計画タスクを解決するパフォーマンスを向上させる新しい自己監視時間の時間差メトリック学習アプローチを提案します。
私たちの方法は、ベルマンの有限領域にわたる最適性の原則を強制します。時間的差異学習を使用して、エイコナル方程式の必須測地特性を保存するためにメトリック学習を組み込んでいる間、偽の局所的最小値を避けます。
私たちのアプローチは、複雑な環境の取り扱いと目に見えない環境への一般化において、既存の自己監視学習方法を大幅に上回ることを実証します。

要約(オリジナル)

The motion planning problem involves finding a collision-free path from a robot’s starting to its target configuration. Recently, self-supervised learning methods have emerged to tackle motion planning problems without requiring expensive expert demonstrations. They solve the Eikonal equation for training neural networks and lead to efficient solutions. However, these methods struggle in complex environments because they fail to maintain key properties of the Eikonal equation, such as optimal value functions and geodesic distances. To overcome these limitations, we propose a novel self-supervised temporal difference metric learning approach that solves the Eikonal equation more accurately and enhances performance in solving complex and unseen planning tasks. Our method enforces Bellman’s principle of optimality over finite regions, using temporal difference learning to avoid spurious local minima while incorporating metric learning to preserve the Eikonal equation’s essential geodesic properties. We demonstrate that our approach significantly outperforms existing self-supervised learning methods in handling complex environments and generalizing to unseen environments, with robot configurations ranging from 2 to 12 degrees of freedom (DOF).

arxiv情報

著者 Ruiqi Ni,Zherong Pan,Ahmed H Qureshi
発行日 2025-05-09 00:02:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Physics-informed Temporal Difference Metric Learning for Robot Motion Planning はコメントを受け付けていません

Quantitative Hardness Assessment with Vision-based Tactile Sensing for Fruit Classification and Grasping

要約

果物の硬度の正確な推定は、特に果物の多様性を決定し、熟度を評価し、適切な収穫力を確保するために、自動化された分類および取り扱いシステムに不可欠です。
この研究では、農業におけるロボットアプリケーションのために明示的に調整された視覚ベースの触覚センシングを利用した定量的硬度評価のための革新的な枠組みを提示します。
提案された方法論は、視力ベースの触覚センサーから通常の力の推定を導き出し、この正常な力のダイナミクスに基づいて、硬度を計算します。
このアプローチは、単一接触相互作用を通じて迅速で非破壊的な評価を提供します。
このフレームワークをロボットシステムに統合すると、握る力のリアルタイムの適応性が向上し、それにより果物の損傷の可能性が減少します。
さらに、このアプローチの一般的な適用可能性は、平均的な通常の力のダイナミクスに基づく普遍的な基準を通じて、さまざまな果物のタイプとサイズにわたってその有効性を保証します。
さまざまな果物タイプと熟度追跡研究で実施された広範な実験的検証は、フレームワークの有効性と堅牢性を示し、自動化された果物取り扱いの領域で大きな進歩を示しています。

要約(オリジナル)

Accurate estimation of fruit hardness is essential for automated classification and handling systems, particularly in determining fruit variety, assessing ripeness, and ensuring proper harvesting force. This study presents an innovative framework for quantitative hardness assessment utilizing vision-based tactile sensing, tailored explicitly for robotic applications in agriculture. The proposed methodology derives normal force estimation from a vision-based tactile sensor, and, based on the dynamics of this normal force, calculates the hardness. This approach offers a rapid, non-destructive evaluation through single-contact interaction. The integration of this framework into robotic systems enhances real-time adaptability of grasping forces, thereby reducing the likelihood of fruit damage. Moreover, the general applicability of this approach, through a universal criterion based on average normal force dynamics, ensures its effectiveness across a wide variety of fruit types and sizes. Extensive experimental validation conducted across different fruit types and ripeness-tracking studies demonstrates the efficacy and robustness of the framework, marking a significant advancement in the domain of automated fruit handling.

arxiv情報

著者 Zhongyuan Liao,Yipai Du,Jianghua Duan,Haobo Liang,Michael Yu Wang
発行日 2025-05-09 01:54:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Quantitative Hardness Assessment with Vision-based Tactile Sensing for Fruit Classification and Grasping はコメントを受け付けていません

Automating Infrastructure Surveying: A Framework for Geometric Measurements and Compliance Assessment Using Point Cloud Data

要約

自動化は、インフラストラクチャ調査における効率、精度、およびスケーラビリティを改善し、建設とコンプライアンスの基準を評価する上で顕著な役割を果たすことができます。
このペーパーでは、幾何学的測定の自動化とポイントクラウドデータを使用したコンプライアンス評価のフレームワークを紹介します。
提案されたアプローチは、幾何学的および信号処理技術と併せて、深い学習ベースの検出とセグメンテーションを統合して、調査タスクを自動化します。
概念の証明として、このフレームワークを適用して、縁石障害者法(ADA)との縁石ランプのコンプライアンスを自動的に評価し、調査自動化におけるポイントクラウドデータの有用性を実証します。
このメソッドは、堅牢なモデルトレーニングと評価を促進するために、この作業の一部として公開された、縁石ランプの新しく収集された大きな注釈付きデータセットを活用します。
いくつかのランプの手動フィールド測定との比較を含む実験結果は、提案された方法の精度と信頼性を検証し、手動の努力を大幅に削減し、インフラストラクチャ評価の一貫性を改善する可能性を強調しています。
ADAコンプライアンスを超えて、提案されたフレームワークは、インフラストラクチャ調査と自動化された建設評価におけるより広範なアプリケーションの基礎を築き、これらのドメインにおけるポイントクラウドデータの幅広い採用を促進します。
注釈付きデータベース、手動ランプ調査データ、および開発されたアルゴリズムは、プロジェクトのGitHubページhttps://github.com/soltanilara/surveyautomationで公開されています。

要約(オリジナル)

Automation can play a prominent role in improving efficiency, accuracy, and scalability in infrastructure surveying and assessing construction and compliance standards. This paper presents a framework for automation of geometric measurements and compliance assessment using point cloud data. The proposed approach integrates deep learning-based detection and segmentation, in conjunction with geometric and signal processing techniques, to automate surveying tasks. As a proof of concept, we apply this framework to automatically evaluate the compliance of curb ramps with the Americans with Disabilities Act (ADA), demonstrating the utility of point cloud data in survey automation. The method leverages a newly collected, large annotated dataset of curb ramps, made publicly available as part of this work, to facilitate robust model training and evaluation. Experimental results, including comparison with manual field measurements of several ramps, validate the accuracy and reliability of the proposed method, highlighting its potential to significantly reduce manual effort and improve consistency in infrastructure assessment. Beyond ADA compliance, the proposed framework lays the groundwork for broader applications in infrastructure surveying and automated construction evaluation, promoting wider adoption of point cloud data in these domains. The annotated database, manual ramp survey data, and developed algorithms are publicly available on the project’s GitHub page: https://github.com/Soltanilara/SurveyAutomation.

arxiv情報

著者 Amin Ghafourian,Andrew Lee,Dechen Gao,Tyler Beer,Kin Yen,Iman Soltani
発行日 2025-05-09 03:24:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.CY, cs.LG, cs.RO, eess.IV | Automating Infrastructure Surveying: A Framework for Geometric Measurements and Compliance Assessment Using Point Cloud Data はコメントを受け付けていません

Towards Embodiment Scaling Laws in Robot Locomotion

要約

多様なタスク、環境、および物理的実施形態で動作できるジェネラリストエージェントの開発は、ロボット工学と人工知能における壮大な課題です。
この作業では、実施形態の軸に焦点を当て、実施形態のスケーリング法$ \ unicode {x2013} $の訓練具体化の数を増やすことで、目に見えないものへの一般化が改善されるという仮説を調査します。
ロボットの移動をテストベッドとして使用して、ヒューマノイド、四足動物、六角形に及ぶ$ \ sim $ 1,000のさまざまな実施形態のデータセットを手続き的に生成し、ランダムなサブセットで多様な観察スペースと作用スペースを処理できるジェネラリストのポリシーを訓練します。
トレーニングの具体化の数を増やすと、目に見えないものへの一般化が改善され、スケーリングの実施形態が、小さく固定された実施形態に関するデータのスケーリングよりも具体化レベルの一般化を可能にするのに効果的であることがわかります。
特に、完全なデータセットで訓練された私たちの最良のポリシーは、Unitree GO2やH1などの現実世界の新しい実施形態へのゼロショット転送です。
これらの結果は、構成可能なロボットの適応制御、形態と制御の共同設計、およびそれ以降の一般的な具体化された知性に向けたステップを表しています。

要約(オリジナル)

Developing generalist agents that can operate across diverse tasks, environments, and physical embodiments is a grand challenge in robotics and artificial intelligence. In this work, we focus on the axis of embodiment and investigate embodiment scaling laws$\unicode{x2013}$the hypothesis that increasing the number of training embodiments improves generalization to unseen ones. Using robot locomotion as a test bed, we procedurally generate a dataset of $\sim$1,000 varied embodiments, spanning humanoids, quadrupeds, and hexapods, and train generalist policies capable of handling diverse observation and action spaces on random subsets. We find that increasing the number of training embodiments improves generalization to unseen ones, and scaling embodiments is more effective in enabling embodiment-level generalization than scaling data on small, fixed sets of embodiments. Notably, our best policy, trained on the full dataset, zero-shot transfers to novel embodiments in the real world, such as Unitree Go2 and H1. These results represent a step toward general embodied intelligence, with potential relevance to adaptive control for configurable robots, co-design of morphology and control, and beyond.

arxiv情報

著者 Bo Ai,Liu Dai,Nico Bohlinger,Dichen Li,Tongzhou Mu,Zhanxin Wu,K. Fay,Henrik I. Christensen,Jan Peters,Hao Su
発行日 2025-05-09 03:25:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Towards Embodiment Scaling Laws in Robot Locomotion はコメントを受け付けていません

Active Contact Engagement for Aerial Navigation in Unknown Environments with Glass

要約

自律的な航空ロボットは、実世界のシナリオにますます展開されています。このシナリオでは、透明なガラス障害物が信頼できるナビゲーションに大きな課題をもたらしています。
研究者は、非接触センサーと受動的な接触抵抗力のある航空車両設計の使用を調査して、ガラス面を検出します。ガラス面は、しばしば堅牢性と効率の点で制限されています。
この作業では、センサーベースと接触ベースのガラス検出の両方の強度を組み合わせた、透明なガラス障害物を備えた未知の環境での堅牢な自律航空ナビゲーションのための新しいアプローチを提案します。
提案されたシステムは、視覚センサーの測定を使用した潜在的なガラス表面に関する増分検出と情報のメンテナンスから始まります。
その後、車両は、視覚的に検出された潜在的なガラス表面と積極的にタッチアクションに関与し、一対の軽量コンタクトセンシングモジュールを使用して存在を確認または無効にします。
これに続いて、ガラスの表面情報で体積マップが効率的に更新され、ガラスの障害物を回避するために安全な軌跡がその場で再配置されます。
さまざまなシナリオでの実世界の実験を通じて提案されたシステムを検証し、ガラス障害を備えた複雑な現実世界環境で効率的で堅牢な自律航海ナビゲーションを可能にする際のその有効性を実証します。

要約(オリジナル)

Autonomous aerial robots are increasingly being deployed in real-world scenarios, where transparent glass obstacles present significant challenges to reliable navigation. Researchers have investigated the use of non-contact sensors and passive contact-resilient aerial vehicle designs to detect glass surfaces, which are often limited in terms of robustness and efficiency. In this work, we propose a novel approach for robust autonomous aerial navigation in unknown environments with transparent glass obstacles, combining the strengths of both sensor-based and contact-based glass detection. The proposed system begins with the incremental detection and information maintenance about potential glass surfaces using visual sensor measurements. The vehicle then actively engages in touch actions with the visually detected potential glass surfaces using a pair of lightweight contact-sensing modules to confirm or invalidate their presence. Following this, the volumetric map is efficiently updated with the glass surface information and safe trajectories are replanned on the fly to circumvent the glass obstacles. We validate the proposed system through real-world experiments in various scenarios, demonstrating its effectiveness in enabling efficient and robust autonomous aerial navigation in complex real-world environments with glass obstacles.

arxiv情報

著者 Xinyi Chen,Yichen Zhang,Hetai Zou,Junzhe Wang,Shaojie Shen
発行日 2025-05-09 03:36:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Active Contact Engagement for Aerial Navigation in Unknown Environments with Glass はコメントを受け付けていません

Multi-Agent Systems for Robotic Autonomy with LLMs

要約

大規模な言語モデル(LLMS)の出現以来、このようなモデルに基づいたさまざまな研究により、特にAIとロボット工学において、大きな学業の注目と影響が維持されています。
この論文では、LLMSを使用したマルチエージェントフレームワークを提案して、ロボットタスク分析、機械設計、およびパス生成のための統合システムを構築します。
このフレームワークには、タスクアナリスト、ロボットデザイナー、Renecortion Learning Designerの3つのコアエージェントが含まれます。
出力は、コードファイルやテクニカルレポートなどのマルチモーダルの結果として、より強力な理解と使いやすさとしてフォーマットされています。
一般化性を比較的評価するために、GPTとDeepSeekの両方のモデルで実験を実施しました。
結果は、提案されたシステムが適切なタスク入力が提供されたときに制御戦略を備えた実行可能なロボットを設計できることを示しており、研究および産業用途におけるロボットシステム開発の効率とアクセシビリティを強化するための実質的な可能性を示しています。

要約(オリジナル)

Since the advent of Large Language Models (LLMs), various research based on such models have maintained significant academic attention and impact, especially in AI and robotics. In this paper, we propose a multi-agent framework with LLMs to construct an integrated system for robotic task analysis, mechanical design, and path generation. The framework includes three core agents: Task Analyst, Robot Designer, and Reinforcement Learning Designer. Outputs are formatted as multimodal results, such as code files or technical reports, for stronger understandability and usability. To evaluate generalizability comparatively, we conducted experiments with models from both GPT and DeepSeek. Results demonstrate that the proposed system can design feasible robots with control strategies when appropriate task inputs are provided, exhibiting substantial potential for enhancing the efficiency and accessibility of robotic system development in research and industrial applications.

arxiv情報

著者 Junhong Chen,Ziqi Yang,Haoyuan G Xu,Dandan Zhang,George Mylonas
発行日 2025-05-09 03:52:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Multi-Agent Systems for Robotic Autonomy with LLMs はコメントを受け付けていません