A Learning Framework for Diverse Legged Robot Locomotion Using Barrier-Based Style Rewards

要約

この作業では、さまざまな動きモード(四足動物、三脚、または二重ドラミング)と、脚のあるロボットの移動のための多様なタスクを可能にするモデルフリーの強化学習フレームワークを紹介します。
私たちは、リラックスした対数障壁機能に基づいたモーションスタイルの報酬をソフト制約として採用し、歩行、フットクリアランス、関節位置、身体の高さなどの望ましいモーションスタイルに向けて学習プロセスをバイアスします。
事前定義された歩行サイクルは、柔軟な方法でエンコードされ、学習プロセス全体で歩行調整を促進します。
広範な実験は、45 kgのロボットシステムであるKaist Houndが、提案されたフレームワークを使用して、二型、三脚、および4四倍の移動を実現できることを示しています。
4四骨機能には、不均一な地形の移動、4.67 m/sでのギャロッピング、最大58 cm(Hound2の場合は67 cm)までの障害物の克服が含まれます。
Bipedal機能には、3.6 m/sでの実行、7.5 kgのオブジェクトを運ぶこと、上昇する階段は、外部受容的な入力なしで実行されます。

要約(オリジナル)

This work introduces a model-free reinforcement learning framework that enables various modes of motion (quadruped, tripod, or biped) and diverse tasks for legged robot locomotion. We employ a motion-style reward based on a relaxed logarithmic barrier function as a soft constraint, to bias the learning process toward the desired motion style, such as gait, foot clearance, joint position, or body height. The predefined gait cycle is encoded in a flexible manner, facilitating gait adjustments throughout the learning process. Extensive experiments demonstrate that KAIST HOUND, a 45 kg robotic system, can achieve biped, tripod, and quadruped locomotion using the proposed framework; quadrupedal capabilities include traversing uneven terrain, galloping at 4.67 m/s, and overcoming obstacles up to 58 cm (67 cm for HOUND2); bipedal capabilities include running at 3.6 m/s, carrying a 7.5 kg object, and ascending stairs-all performed without exteroceptive input.

arxiv情報

著者 Gijeong Kim,Yong-Hoon Lee,Hae-Won Park
発行日 2025-05-09 07:26:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Learning Framework for Diverse Legged Robot Locomotion Using Barrier-Based Style Rewards はコメントを受け付けていません

Collecting Human Motion Data in Large and Occlusion-Prone Environments using Ultra-Wideband Localization

要約

ロボットが人間の環境にますます統合されているため、安全で効率的な相互作用には、人間の動きを理解して予測することが不可欠です。
最新の人間の動きと活動予測のアプローチには、通常、モーションキャプチャシステム、オンボード、または固定センサーから収集されるトレーニングと評価のための高品質と量のデータが必要です。
これらのシステムのセットアップは、ハードウェアコンポーネントの複雑なセットアップ、広範なキャリブレーション手順、閉塞、および実質的なコストのために困難です。
これらの制約により、このようなシステムを新しい環境と大規模な環境に展開することが困難になり、野生の測定の使いやすさが制限されます。
この論文では、混雑した閉塞が発生しやすい環境での人間のモーションキャプチャのためのスケーラブルな代替品として、新しい超幅帯域(UWB)ローカリゼーション技術を適用する可能性を調査します。
視力、オンボードロボットライダー、レーダーセンサーなどの追加のセンシングモダリティを含め、評価と比較のためのグラウンドトゥルースとしてモーションキャプチャデータを記録します。
環境は博物館のセットアップを模倣しており、最大4人のアクティブな参加者が自然な方法でランダムな目標に向かってナビゲートし、130分以上のマルチモーダルデータを提供しています。
私たちの調査は、視力ベースのシステムを超えたスケーラブルで正確なモーションデータの収集に向けて、倉庫、空港、コンベンションセンターなどの大規模で複雑な環境でUWBのようなセンシングモダリティを評価するための基盤を築くためのステップを提供します。

要約(オリジナル)

With robots increasingly integrating into human environments, understanding and predicting human motion is essential for safe and efficient interactions. Modern human motion and activity prediction approaches require high quality and quantity of data for training and evaluation, usually collected from motion capture systems, onboard or stationary sensors. Setting up these systems is challenging due to the intricate setup of hardware components, extensive calibration procedures, occlusions, and substantial costs. These constraints make deploying such systems in new and large environments difficult and limit their usability for in-the-wild measurements. In this paper we investigate the possibility to apply the novel Ultra-Wideband (UWB) localization technology as a scalable alternative for human motion capture in crowded and occlusion-prone environments. We include additional sensing modalities such as eye-tracking, onboard robot LiDAR and radar sensors, and record motion capture data as ground truth for evaluation and comparison. The environment imitates a museum setup, with up to four active participants navigating toward random goals in a natural way, and offers more than 130 minutes of multi-modal data. Our investigation provides a step toward scalable and accurate motion data collection beyond vision-based systems, laying a foundation for evaluating sensing modalities like UWB in larger and complex environments like warehouses, airports, or convention centers.

arxiv情報

著者 Janik Kaden,Maximilian Hilger,Tim Schreiter,Marius Schaab,Thomas Graichen,Andrey Rudenko,Ulrich Heinkel,Achim J. Lilienthal
発行日 2025-05-09 07:44:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, cs.RO | Collecting Human Motion Data in Large and Occlusion-Prone Environments using Ultra-Wideband Localization はコメントを受け付けていません

TAPTRv2: Attention-based Position Update Improves Tracking Any Point

要約

このホワイトペーパーでは、TAPTRベースのアプローチであるTAPTRV2を、TAPTRに基づいて構築され、トラッキング任意のポイント(TAP)タスクを解決します。
TAPTRは、検出トランス(DETR)から設計を設計し、各追跡ポイントをポイントクエリとして定式化し、DETRのようなアルゴリズムでよく研究された操作を活用できるようにします。
TAPTRV2は、ポイントクエリのコンテンツ機能を汚染し、可視性の予測とコストボリューム計算の両方に悪影響を与えるコストボリュームへの依存に関する重要な問題に対処することにより、TAPTRを改善します。
TAPTRV2では、新しい注意ベースのポジションアップデート(APU)操作を提案し、キーアウェアの変形可能な注意を使用して実現します。
クエリごとに、この操作はキーアウェアの注意重みを使用して、対応する変形可能なサンプリング位置を組み合わせて新しいクエリ位置を予測します。
この設計は、局所的な注意は基本的にコストボリュームと同じであるという観察に基づいており、どちらもクエリとその周辺の特徴の間のドットプロダクションによって計算されます。
この新しい操作を導入することにより、TAPTRV2はコスト容量計算の余分な負担を削除するだけでなく、大幅なパフォーマンス改善にもつながります。
TAPTRV2はTAPTRを上回り、多くの挑戦的なデータセットで最先端のパフォーマンスを達成し、優位性を実証します

要約(オリジナル)

In this paper, we present TAPTRv2, a Transformer-based approach built upon TAPTR for solving the Tracking Any Point (TAP) task. TAPTR borrows designs from DEtection TRansformer (DETR) and formulates each tracking point as a point query, making it possible to leverage well-studied operations in DETR-like algorithms. TAPTRv2 improves TAPTR by addressing a critical issue regarding its reliance on cost-volume,which contaminates the point query\’s content feature and negatively impacts both visibility prediction and cost-volume computation. In TAPTRv2, we propose a novel attention-based position update (APU) operation and use key-aware deformable attention to realize. For each query, this operation uses key-aware attention weights to combine their corresponding deformable sampling positions to predict a new query position. This design is based on the observation that local attention is essentially the same as cost-volume, both of which are computed by dot-production between a query and its surrounding features. By introducing this new operation, TAPTRv2 not only removes the extra burden of cost-volume computation, but also leads to a substantial performance improvement. TAPTRv2 surpasses TAPTR and achieves state-of-the-art performance on many challenging datasets, demonstrating the superiority

arxiv情報

著者 Hongyang Li,Hao Zhang,Shilong Liu,Zhaoyang Zeng,Feng Li,Tianhe Ren,Bohan Li,Lei Zhang
発行日 2025-05-09 08:02:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | TAPTRv2: Attention-based Position Update Improves Tracking Any Point はコメントを受け付けていません

Adaptive Robot Localization with Ultra-wideband Novelty Detection

要約

ウルトラワイドバンド(UWB)テクノロジーは、ロボットのローカリゼーションのための低コストの一般的なソリューションとして顕著な可能性を示しています。
ただし、反射率、マルチパス効果、および非表示(NLOS)条件により、正確な位置決めのためのUWB信号の制限は、環境自体によって引き起こされる障害から生じます。
この問題は、サービスロボットプラットフォームが通常動作する乱雑な屋内スペースで強調されています。
モデルベースと学習ベースの両方の方法は現在、UWBエラーパターンを正確に予測するために調査中です。
強い非線形性を近似する能力にもかかわらず、学習ベースの方法は環境要因を考慮せず、目に見えないデータ分布のためにデータ収集と再トレーニングを必要とすることが多いため、大規模に実質的に実行不可能になります。
この研究の目標は、屋内閉じ込められたスペースのための堅牢で適応的なUWBローカリゼーション法を開発することです。
ノベルティ検出手法は、半監視された自動エンコーダーを使用した名目UWB範囲データからの異常値の条件を認識するために使用されます。
次に、得られたノベルティスコアは、UWBアンカーから受け取った各範囲測定の共分散とバイアス誤差の動的推定を活用して、拡張カルマンフィルターと組み合わされます。
結果としてのソリューションは、環境内のUWBデータの信頼性をローカリゼーションシステムを適応させることを可能にするコンパクトで柔軟で堅牢なシステムです。
幅広いテストシナリオで実際のロボットを使用して実施された広範な実験は、NLOS条件を提示する屋内乱雑なスペースで提案されたソリューションの利点と利点を示しており、ほぼ60%、絶対位置誤りの25cmを超える平均改善に達します。

要約(オリジナル)

Ultra-wideband (UWB) technology has shown remarkable potential as a low-cost general solution for robot localization. However, limitations of the UWB signal for precise positioning arise from the disturbances caused by the environment itself, due to reflectance, multi-path effect, and Non-Line-of-Sight (NLOS) conditions. This problem is emphasized in cluttered indoor spaces where service robotic platforms usually operate. Both model-based and learning-based methods are currently under investigation to precisely predict the UWB error patterns. Despite the great capability in approximating strong non-linearity, learning-based methods often do not consider environmental factors and require data collection and re-training for unseen data distributions, making them not practically feasible on a large scale. The goal of this research is to develop a robust and adaptive UWB localization method for indoor confined spaces. A novelty detection technique is used to recognize outlier conditions from nominal UWB range data with a semi-supervised autoencoder. Then, the obtained novelty scores are combined with an Extended Kalman filter, leveraging a dynamic estimation of covariance and bias error for each range measurement received from the UWB anchors. The resulting solution is a compact, flexible, and robust system which enables the localization system to adapt the trustworthiness of UWB data spatially and temporally in the environment. The extensive experimentation conducted with a real robot in a wide range of testing scenarios demonstrates the advantages and benefits of the proposed solution in indoor cluttered spaces presenting NLoS conditions, reaching an average improvement of almost 60% and greater than 25cm of absolute positioning error.

arxiv情報

著者 Umberto Albertin,Mauro Martini,Alessandro Navone,Marcello Chiaberge
発行日 2025-05-09 09:17:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Adaptive Robot Localization with Ultra-wideband Novelty Detection はコメントを受け付けていません

3D Hand-Eye Calibration for Collaborative Robot Arm: Look at Robot Base Once

要約

手と目のキャリブレーションは、視覚センサーとロボットフランジの間の変換マトリックスの決定を伴う共同ロボット工学の分野で一般的な問題です。
ただし、このプロセスには通常、ロボットアームと外部キャリブレーションオブジェクトの複数の動きが必要であり、特に頻繁な再調整が必要なシナリオでは、時間がかかり、不便になります。
この作業では、チェスボードなどの外部キャリブレーションオブジェクトの必要性を排除する以前の方法を拡張します。
ポイントクラウド登録のための一般的なデータセット生成アプローチを提案し、ロボットベースポイントクラウドとスキャンされたデータを合わせることに焦点を当てています。
さらに、いくつかの異なる共同ロボットアームを含む、より詳細なシミュレーション研究が実施され、その後、産業環境での実際の実験が行われます。
改良された方法は、KUKA、Universal Robots、Ufactory、Franka Emikaを含む9つの異なるブランドの合計14のロボットアームを使用してシミュレートおよび評価されます。これらはすべて、共同ロボット工学の分野で広く使用されています。
物理実験は、拡張されたアプローチが既存の商用ハンドアイキャリブレーションソリューションに匹敵するパフォーマンスを達成し、数秒でキャリブレーション手順全体を完了することを示しています。
さらに、github.com/leihui6/lrboで公開されているコードを使用して、ユーザーフレンドリーなハンドアイキャリブレーションソリューションを提供します。

要約(オリジナル)

Hand-eye calibration is a common problem in the field of collaborative robotics, involving the determination of the transformation matrix between the visual sensor and the robot flange to enable vision-based robotic tasks. However, this process typically requires multiple movements of the robot arm and an external calibration object, making it both time-consuming and inconvenient, especially in scenarios where frequent recalibration is necessary. In this work, we extend our previous method which eliminates the need for external calibration objects such as a chessboard. We propose a generic dataset generation approach for point cloud registration, focusing on aligning the robot base point cloud with the scanned data. Furthermore, a more detailed simulation study is conducted involving several different collaborative robot arms, followed by real-world experiments in an industrial setting. Our improved method is simulated and evaluated using a total of 14 robotic arms from 9 different brands, including KUKA, Universal Robots, UFACTORY, and Franka Emika, all of which are widely used in the field of collaborative robotics. Physical experiments demonstrate that our extended approach achieves performance comparable to existing commercial hand-eye calibration solutions, while completing the entire calibration procedure in just a few seconds. In addition, we provide a user-friendly hand-eye calibration solution, with the code publicly available at github.com/leihui6/LRBO.

arxiv情報

著者 Leihui Li,Lixuepiao Wan,Volker Krueger,Xuping Zhang
発行日 2025-05-09 09:45:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | 3D Hand-Eye Calibration for Collaborative Robot Arm: Look at Robot Base Once はコメントを受け付けていません

Embedded Hierarchical MPC for Autonomous Navigation

要約

社会でロボットシステムを効率的に展開するには、モバイルロボットは複雑な環境を通じて自律的かつ安全に移動する必要があります。
非線形モデル予測制御(MPC)メソッドは、近くの障害と衝突することなく、環境を通して動的に実行可能な軌跡を見つける自然な方法を提供します。
ただし、Quadrotorsなどの典型的な埋め込みロボットシステムで利用可能な限られた計算能力は、最も高価なタスク、制約の生成と最適化など、MPCをリアルタイムで実行することに課題をもたらします。
この問題に対処するために、計画と追跡層で構成される新しい階層MPCスキームを提案します。
プランナーは、速度で長い予測の地平線で軌道を構築しますが、トラッカーは比較的速い速度で軌道追跡を保証します。
提案されたフレームワークが衝突を回避し、再帰的に実行可能であることを証明します。
さらに、複雑な静的環境で目標の位置に到達する必要がある四角体でのシミュレーションとラボ実験における有効性を示します。
このコードは、リアルタイムの実現可能性を確保するために、Quadrotorの埋め込みコンピューターに効率的に実装されています。
最先端のシングルレイヤーMPC製剤と比較して、これにより計画期間を5倍にすることができ、パフォーマンスが大幅に向上します。

要約(オリジナル)

To efficiently deploy robotic systems in society, mobile robots must move autonomously and safely through complex environments. Nonlinear model predictive control (MPC) methods provide a natural way to find a dynamically feasible trajectory through the environment without colliding with nearby obstacles. However, the limited computation power available on typical embedded robotic systems, such as quadrotors, poses a challenge to running MPC in real time, including its most expensive tasks: constraints generation and optimization. To address this problem, we propose a novel hierarchical MPC scheme that consists of a planning and a tracking layer. The planner constructs a trajectory with a long prediction horizon at a slow rate, while the tracker ensures trajectory tracking at a relatively fast rate. We prove that the proposed framework avoids collisions and is recursively feasible. Furthermore, we demonstrate its effectiveness in simulations and lab experiments with a quadrotor that needs to reach a goal position in a complex static environment. The code is efficiently implemented on the quadrotor’s embedded computer to ensure real-time feasibility. Compared to a state-of-the-art single-layer MPC formulation, this allows us to increase the planning horizon by a factor of 5, which results in significantly better performance.

arxiv情報

著者 Dennis Benders,Johannes Köhler,Thijs Niesten,Robert Babuška,Javier Alonso-Mora,Laura Ferranti
発行日 2025-05-09 10:00:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Embedded Hierarchical MPC for Autonomous Navigation はコメントを受け付けていません

Priority-Driven Safe Model Predictive Control Approach to Autonomous Driving Applications

要約

このペーパーでは、自律運転シナリオへの安全モデル予測制御(SMPC)フレームワークの適用可能性を示しており、適応クルーズコントロール(ACC)と自動レーンチェンジシステムの設計に焦点を当てています。
優先駆動型の制約軟化を伴うSMPCアプローチに基づいて、調整可能な制約の事前定義されたサブセットを選択的に軟化させることにより、外部障害の下で\ emph {hard}制約の満足度を保証します。
リアルタイムの実行を可能にするために、時間がかかるSMPCに近似する学習ベースのアルゴリズムが導入されています。
予測されていない妨害の対象となる現実世界の駆動シナリオのシミュレーションは、この優先順位付けされた軟化メカニズムが一貫して厳しい安全上の制約を維持し、提案された方法の有効性を強調していることを確認します。

要約(オリジナル)

This paper demonstrates the applicability of the safe model predictive control (SMPC) framework to autonomous driving scenarios, focusing on the design of adaptive cruise control (ACC) and automated lane-change systems. Building on the SMPC approach with priority-driven constraint softening — which ensures the satisfaction of \emph{hard} constraints under external disturbances by selectively softening a predefined subset of adjustable constraints — we show how the algorithm dynamically relaxes lower-priority, comfort-related constraints in response to unexpected disturbances while preserving critical safety requirements such as collision avoidance and lane-keeping. A learning-based algorithm approximating the time consuming SMPC is introduced to enable real-time execution. Simulations in real-world driving scenarios subject to unpredicted disturbances confirm that this prioritized softening mechanism consistently upholds stringent safety constraints, underscoring the effectiveness of the proposed method.

arxiv情報

著者 Francesco Prignoli,Ying Shuai Quan,Mohammad Jeddi,Jonas Sjöberg,Paolo Falcone
発行日 2025-05-09 10:24:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Priority-Driven Safe Model Predictive Control Approach to Autonomous Driving Applications はコメントを受け付けていません

A High Efficient and Scalable Obstacle-Avoiding VLSI Global Routing Flow

要約

ルーティングは、VLSI設計フローの重要なステップです。
製造技術の進歩により、特にルーティング中の障害に関して、設計ルールでより多くの制約が現れ、ルーティングの複雑さが増加しました。
残念ながら、多くのグローバルなルーターは、スケーラブルな障害物を回避するツリー生成方法がないため、複雑な障害物とネットを備えた最新のデザインを処理する能力により、障害物のないソリューションを効率的に生成するのに苦労しています。
この作業では、障害物を備えたVLSI設計のための効率的な障害物を意識するグローバルルーティングフローを提案します。
このフローには、ツリー生成フェーズ中に、ルールベースの障害物が直線的なシュタイナー最小ツリー(OARSMT)アルゴリズムを回避することが含まれます。
このアルゴリズムは、グローバルな初期段階で障害を避けるツリートポロジを提供するために、スケーラブルで高速です。
そのガイダンスにより、障害物の違反を最小限に抑え、オーバーフローコストを削減するために、OARSMT誘導と障害物を意識したまばらな迷路ルーティングが後期段階で提案されています。
障害物を備えたベンチマークの高度な方法と比較して、私たちのアプローチは障害物の違反をうまく排除し、有線とオーバーフローコストを削減し、限られた数のカウントとランタイムオーバーヘッドのみを犠牲にします。

要約(オリジナル)

Routing is a crucial step in the VLSI design flow. With the advancement of manufacturing technologies, more constraints have emerged in design rules, particularly regarding obstacles during routing, leading to increased routing complexity. Unfortunately, many global routers struggle to efficiently generate obstacle-free solutions due to the lack of scalable obstacle-avoiding tree generation methods and the capability of handling modern designs with complex obstacles and nets. In this work, we propose an efficient obstacle-aware global routing flow for VLSI designs with obstacles. The flow includes a rule-based obstacle-avoiding rectilinear Steiner minimal tree (OARSMT) algorithm during the tree generation phase. This algorithm is both scalable and fast to provide tree topologies avoiding obstacles in the early stage globally. With its guidance, OARSMT-guided and obstacle-aware sparse maze routing are proposed in the later stages to minimize obstacle violations further and reduce overflow costs. Compared to advanced methods on the benchmark with obstacles, our approach successfully eliminates obstacle violations, and reduces wirelength and overflow cost, while sacrificing only a limited number of via counts and runtime overhead.

arxiv情報

著者 Junhao Guo,Hongxin Kong,Lang Feng
発行日 2025-05-09 11:04:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.OH, cs.RO | A High Efficient and Scalable Obstacle-Avoiding VLSI Global Routing Flow はコメントを受け付けていません

QuickGrasp: Lightweight Antipodal Grasp Planning with Point Clouds

要約

把握は、ロボットと環境の間の最終的なインターフェースを促進する上で長年の課題でした。
環境とタスクが複雑になるにつれて、周囲から推測してそれらに基づいて行動するためにより高い知性を埋め込む必要性が必要になりました。
ほとんどの方法は、6度のフリードーム空間での純粋なサンプリングベースのアプローチまたは学習問題として、問題を扱うことにより、把握ポーズを推定する手法を利用していますが、通常、ドメイン全体の一般化が不十分なため、実際の設定では失敗します。
さらに、非効率性と既存の把握計画アプローチの確率的性質をサンプリングするために、把握計画と再現性の欠如を生成するのにかかった時間は、実際のタスクでの適用を厳しく制限します。
このペーパーでは、ロボットグラスプランニング、特にアンチポーダルグラスクに対する軽量の分析的アプローチを提示します。
提案されている把握計画アルゴリズムは、エンド効果のポーズを直接推定するのではなく、オブジェクト表面の把握ポイントを推定するための最適化問題として定式化されます。
この程度まで、湾曲した表面の場合でも、効果的な平面セグメンテーションのために、ソフト領域成長アルゴリズムが提示されます。
次に、最適化ベースの品質メトリックを把握ポイントの評価に使用して、間接力の閉鎖を保証します。
提案された把握フレームワークは、複数のシミュレートされたオブジェクトのベースラインとして、既存の最先端の把握計画アプローチであるGrasp Pose Detection(GPD)と比較されます。
GPDと比較した提案されたアプローチの有効性は、ImageおよびPoint-Cloudデータを使用した実際の設定でも評価され、LobotiqグリッパーとUR5マニピュレーターを使用して計画されたグラスプが実行されます。

要約(オリジナル)

Grasping has been a long-standing challenge in facilitating the final interface between a robot and the environment. As environments and tasks become complicated, the need to embed higher intelligence to infer from the surroundings and act on them has become necessary. Although most methods utilize techniques to estimate grasp pose by treating the problem via pure sampling-based approaches in the six-degree-of-freedom space or as a learning problem, they usually fail in real-life settings owing to poor generalization across domains. In addition, the time taken to generate the grasp plan and the lack of repeatability, owing to sampling inefficiency and the probabilistic nature of existing grasp planning approaches, severely limits their application in real-world tasks. This paper presents a lightweight analytical approach towards robotic grasp planning, particularly antipodal grasps, with little to no sampling in the six-degree-of-freedom space. The proposed grasp planning algorithm is formulated as an optimization problem towards estimating grasp points on the object surface instead of directly estimating the end-effector pose. To this extent, a soft-region-growing algorithm is presented for effective plane segmentation, even in the case of curved surfaces. An optimization-based quality metric is then used for the evaluation of grasp points to ensure indirect force closure. The proposed grasp framework is compared with the existing state-of-the-art grasp planning approach, Grasp pose detection (GPD), as a baseline over multiple simulated objects. The effectiveness of the proposed approach in comparison to GPD is also evaluated in a real-world setting using image and point-cloud data, with the planned grasps being executed using a ROBOTIQ gripper and UR5 manipulator.

arxiv情報

著者 Navin Sriram Ravie,Keerthi Vasan M,Asokan Thondiyath,Bijo Sebastian
発行日 2025-05-09 11:18:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | QuickGrasp: Lightweight Antipodal Grasp Planning with Point Clouds はコメントを受け付けていません

Exact Imposition of Safety Boundary Conditions in Neural Reachable Tubes

要約

Hamilton-Jacobi(HJ)Reachability Analysisは、自律システムの安全性とパフォーマンス保証を提供するための広く採用されている検証ツールです。
ただし、部分的な微分方程式(PDE)を解き、安全価値関数を計算することが含まれます。安全価値関数は、その計算とメモリの複雑さが状態の次元と指数関数的にスケーリングされ、大規模システムへの直接の適用が扱いにくいものです。
これらの課題を克服するために、最近提案された学習ベースのアプローチであるDeepReachは、ニューラルネットワーク(NNS)を使用して高次元の到達可能なチューブに近似しています。
効果的であることが示されていますが、学習されたソリューションの精度はシステムの複雑さとともに減少します。
この劣化の理由の1つは、学習プロセス中の安全性の制約のソフトな賦課であり、これはPDEの境界条件に対応し、不正確な値関数をもたらします。
この作業では、境界条件とNN出力の加重合計として全体的な値関数を再構築することにより、学習プロセス中に安全性の制約を正確に課す深いreachのバリアントであるExactBCを提案します。
さらに、提案されたバリアントは、トレーニングプロセス中に境界損失項を必要としなくなるため、異なる損失項のバランスをとる必要性を排除します。
4つの挑戦的な到達可能性タスクの学習価値関数の精度を大幅に改善する上で提案されたアプローチの有効性を実証します。状態リセットを備えたリムレスホイールシステム、散らかった環境での衝突回避、自律ロケット着陸、および複数の航空機の衝突回避です。

要約(オリジナル)

Hamilton-Jacobi (HJ) reachability analysis is a widely adopted verification tool to provide safety and performance guarantees for autonomous systems. However, it involves solving a partial differential equation (PDE) to compute a safety value function, whose computational and memory complexity scales exponentially with the state dimension, making its direct application to large-scale systems intractable. To overcome these challenges, DeepReach, a recently proposed learning-based approach, approximates high-dimensional reachable tubes using neural networks (NNs). While shown to be effective, the accuracy of the learned solution decreases with system complexity. One of the reasons for this degradation is a soft imposition of safety constraints during the learning process, which corresponds to the boundary conditions of the PDE, resulting in inaccurate value functions. In this work, we propose ExactBC, a variant of DeepReach that imposes safety constraints exactly during the learning process by restructuring the overall value function as a weighted sum of the boundary condition and the NN output. Moreover, the proposed variant no longer needs a boundary loss term during the training process, thus eliminating the need to balance different loss terms. We demonstrate the efficacy of the proposed approach in significantly improving the accuracy of the learned value function for four challenging reachability tasks: a rimless wheel system with state resets, collision avoidance in a cluttered environment, autonomous rocket landing, and multi-aircraft collision avoidance.

arxiv情報

著者 Aditya Singh,Zeyuan Feng,Somil Bansal
発行日 2025-05-09 12:37:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Exact Imposition of Safety Boundary Conditions in Neural Reachable Tubes はコメントを受け付けていません