Approaching Current Challenges in Developing a Software Stack for Fully Autonomous Driving

要約

自律運転は複雑な取り組みです。
一般的なアプローチは、モジュール化を通じて運転タスクを個々のサブタスクに分解することです。
これらのサブモジュールは通常、個別に開発および公開されます。
ただし、これらの個別に開発されたアルゴリズムを再度組み合わせてフルスタックの自律運転ソフトウェアを形成する必要がある場合、これは特定の課題をもたらします。
Tum Autonomous Motorsportのソフトウェアを開発する際の実際の経験に基づいて、科学環境内で自律的な駆動ソフトウェアスタックの開発におけるこれらの課題を特定し、導き出しました。
個々のアルゴリズムの特定の課題ではなく、実際のテスト車両に研究アルゴリズムを展開するときに発生する一般的な困難に焦点を当てています。
これらの課題を克服するために、開発アプローチに効果的な戦略を紹介します。
さらに、GitHubでこれらの概念を有効にするオープンソースの実装を提供します。
その結果、このペーパーの貢献により、将来のフルスタックの自律運転プロジェクトが簡素化されます。これは、個々のアルゴリズムの徹底的な評価に不可欠です。

要約(オリジナル)

Autonomous driving is a complex undertaking. A common approach is to break down the driving task into individual subtasks through modularization. These sub-modules are usually developed and published separately. However, if these individually developed algorithms have to be combined again to form a full-stack autonomous driving software, this poses particular challenges. Drawing upon our practical experience in developing the software of TUM Autonomous Motorsport, we have identified and derived these challenges in developing an autonomous driving software stack within a scientific environment. We do not focus on the specific challenges of individual algorithms but on the general difficulties that arise when deploying research algorithms on real-world test vehicles. To overcome these challenges, we introduce strategies that have been effective in our development approach. We additionally provide open-source implementations that enable these concepts on GitHub. As a result, this paper’s contributions will simplify future full-stack autonomous driving projects, which are essential for a thorough evaluation of the individual algorithms.

arxiv情報

著者 Simon Sagmeister,Simon Hoffmann,Tobias Betz,Dominic Ebner,Daniel Esser,Markus Lienkamp
発行日 2025-04-17 10:17:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SE | Approaching Current Challenges in Developing a Software Stack for Fully Autonomous Driving はコメントを受け付けていません

Explainable Scene Understanding with Qualitative Representations and Graph Neural Networks

要約

このホワイトペーパーでは、自動運転でのシーンを理解するためのグラフニューラルネットワーク(GNNS)と定性的説明可能なグラフ(QXG)の統合を調査します。
シーンの理解は、さらに反応的または積極的な意思決定の基礎です。
シーンの理解と関連する推論は、本質的に説明タスクです。なぜ別のトラフィック参加者が何かをしているのか、何または誰が彼らの行動を引き起こしたのですか?
以前の研究では、浅い機械学習モデルを使用したQXGSの有効性が実証されていましたが、これらのアプローチは、オブジェクトペア間の単一関係チェーンの分析に限定され、より広いシーンのコンテキストを無視していました。
グラフ構造全体を処理してトラフィックシーンで関連するオブジェクトを識別する新しいGNNアーキテクチャを提案します。
Drivelmのヒトが注目した関連ラベルが豊富なヌスケンデータセットでの方法を評価します。
実験結果は、GNNベースのアプローチがベースライン方法と比較して優れたパフォーマンスを達成することを示しています。
このモデルは、シーン内のすべてのオブジェクト間の完全な空間的関係を考慮しながら、関連するオブジェクト識別タスクの固有のクラスの不均衡を効果的に処理します。
私たちの研究は、自律運転システムで説明可能なシーン理解のために、質的表現を深い学習アプローチと組み合わせる可能性を示しています。

要約(オリジナル)

This paper investigates the integration of graph neural networks (GNNs) with Qualitative Explainable Graphs (QXGs) for scene understanding in automated driving. Scene understanding is the basis for any further reactive or proactive decision-making. Scene understanding and related reasoning is inherently an explanation task: why is another traffic participant doing something, what or who caused their actions? While previous work demonstrated QXGs’ effectiveness using shallow machine learning models, these approaches were limited to analysing single relation chains between object pairs, disregarding the broader scene context. We propose a novel GNN architecture that processes entire graph structures to identify relevant objects in traffic scenes. We evaluate our method on the nuScenes dataset enriched with DriveLM’s human-annotated relevance labels. Experimental results show that our GNN-based approach achieves superior performance compared to baseline methods. The model effectively handles the inherent class imbalance in relevant object identification tasks while considering the complete spatial-temporal relationships between all objects in the scene. Our work demonstrates the potential of combining qualitative representations with deep learning approaches for explainable scene understanding in autonomous driving systems.

arxiv情報

著者 Nassim Belmecheri,Arnaud Gotlieb,Nadjib Lazaar,Helge Spieker
発行日 2025-04-17 10:21:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO | Explainable Scene Understanding with Qualitative Representations and Graph Neural Networks はコメントを受け付けていません

UncAD: Towards Safe End-to-end Autonomous Driving via Online Map Uncertainty

要約

エンドツーエンドの自律運転は、生センサーからの計画軌跡を直接作成することを目的としています。
現在、ほとんどのアプローチは、知覚、予測、および計画モジュールを完全に微分可能なネットワークに統合し、優れたスケーラビリティを約束しています。
ただし、これらの方法は通常、車両計画を導くまたは制約するための認識モジュール内のオンラインマップの決定論的モデリングに依存しており、誤った認識情報を組み込んだり、計画の安全性をさらに妥協したりする可能性があります。
この問題に対処するために、自律運転の安全性を高めるためのオンラインマップの不確実性の重要性を掘り下げ、UNCADという名前の新しいパラダイムを提案します。
具体的には、UNCADは最初に、知覚モジュールのオンラインマップの不確実性を推定します。
次に、不確実性を活用して、モーション予測と計画モジュールを導き、マルチモーダルの軌跡を生成します。
最後に、より安全な自律運転を達成するために、UNSADは、最適な軌跡を評価および選択するために、オンラインマップの不確実性に従って、不確実性衝突に対応する計画選択戦略を提案します。
この研究では、UNCADをさまざまな最先端(SOTA)エンドツーエンドの方法に組み込みます。
Nuscenesデータセットの実験では、パラメーターが1.9%増加したUNCADを統合すると、衝突率が最大26%増加し、駆動可能なエリア競合率が最大42%減少することが示されています。
コード、事前に訓練されたモデル、およびデモビデオには、https://github.com/pengxuanyang/uncadでアクセスできます。

要約(オリジナル)

End-to-end autonomous driving aims to produce planning trajectories from raw sensors directly. Currently, most approaches integrate perception, prediction, and planning modules into a fully differentiable network, promising great scalability. However, these methods typically rely on deterministic modeling of online maps in the perception module for guiding or constraining vehicle planning, which may incorporate erroneous perception information and further compromise planning safety. To address this issue, we delve into the importance of online map uncertainty for enhancing autonomous driving safety and propose a novel paradigm named UncAD. Specifically, UncAD first estimates the uncertainty of the online map in the perception module. It then leverages the uncertainty to guide motion prediction and planning modules to produce multi-modal trajectories. Finally, to achieve safer autonomous driving, UncAD proposes an uncertainty-collision-aware planning selection strategy according to the online map uncertainty to evaluate and select the best trajectory. In this study, we incorporate UncAD into various state-of-the-art (SOTA) end-to-end methods. Experiments on the nuScenes dataset show that integrating UncAD, with only a 1.9% increase in parameters, can reduce collision rates by up to 26% and drivable area conflict rate by up to 42%. Codes, pre-trained models, and demo videos can be accessed at https://github.com/pengxuanyang/UncAD.

arxiv情報

著者 Pengxuan Yang,Yupeng Zheng,Qichao Zhang,Kefei Zhu,Zebin Xing,Qiao Lin,Yun-Fu Liu,Zhiguo Su,Dongbin Zhao
発行日 2025-04-17 10:40:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | UncAD: Towards Safe End-to-end Autonomous Driving via Online Map Uncertainty はコメントを受け付けていません

Curriculum-based Sample Efficient Reinforcement Learning for Robust Stabilization of a Quadrotor

要約

この記事では、事前定義されたパフォーマンス基準を満たす四肢装置の強化学習ベースの堅牢な安定コントローラーを開発するためのカリキュラム学習アプローチを紹介します。
学習目的は、一時的および定常状態のパフォーマンス仕様の両方に準拠しながら、ランダムな初期条件から望ましい位置を達成することです。
この目的は、位置と方向のダイナミクスの強い結合、報酬機能の設計と調整の複雑さ、および実質的な計算リソースを必要とするサンプル効率の低下と、拡張収束時間につながるため、従来の1段階のエンドツーエンドの強化学習にとって困難です。
これらの課題に対処するために、この作業は学習目標を3段階のカリキュラムに分解し、タスクの複雑さを徐々に増加させます。
カリキュラムは、固定された初期条件から安定したホバリングを達成することを学ぶことから始まり、その後、初期位置、方向、速度でランダム化を徐々に導入します。
過渡的および定常状態のパフォーマンス仕様を組み込むために、新しい添加剤報酬関数が提案されています。
結果は、提案された報酬構造と組み合わせた近位政策最適化(PPO)ベースのカリキュラム学習アプローチが、同じ報酬関数を備えた単一段階のPPO訓練ポリシーと比較して優れたパフォーマンスを達成し、計算リソース要件と収束時間を大幅に削減することを示しています。
カリキュラム訓練を受けたポリシーのパフォーマンスと堅牢性は、ランダムな初期条件下で、妨害の存在下で徹底的に検証されます。

要約(オリジナル)

This article introduces a curriculum learning approach to develop a reinforcement learning-based robust stabilizing controller for a Quadrotor that meets predefined performance criteria. The learning objective is to achieve desired positions from random initial conditions while adhering to both transient and steady-state performance specifications. This objective is challenging for conventional one-stage end-to-end reinforcement learning, due to the strong coupling between position and orientation dynamics, the complexity in designing and tuning the reward function, and poor sample efficiency, which necessitates substantial computational resources and leads to extended convergence times. To address these challenges, this work decomposes the learning objective into a three-stage curriculum that incrementally increases task complexity. The curriculum begins with learning to achieve stable hovering from a fixed initial condition, followed by progressively introducing randomization in initial positions, orientations and velocities. A novel additive reward function is proposed, to incorporate transient and steady-state performance specifications. The results demonstrate that the Proximal Policy Optimization (PPO)-based curriculum learning approach, coupled with the proposed reward structure, achieves superior performance compared to a single-stage PPO-trained policy with the same reward function, while significantly reducing computational resource requirements and convergence time. The curriculum-trained policy’s performance and robustness are thoroughly validated under random initial conditions and in the presence of disturbances.

arxiv情報

著者 Fausto Mauricio Lagos Suarez,Akshit Saradagi,Vidya Sumathy,Shruti Kotpaliwar,George Nikolakopoulos
発行日 2025-04-17 11:14:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Curriculum-based Sample Efficient Reinforcement Learning for Robust Stabilization of a Quadrotor はコメントを受け付けていません

Versatile, Robust, and Explosive Locomotion with Rigid and Articulated Compliant Quadrupeds

要約

動的な不確実性に対して堅牢性を備えた汎用性の高い爆発的な動きを達成することは、困難な作業です。
Quadrupedal設計に並行コンプライアンスを導入することは、運動性能を向上させると見なされますが、これにより制御タスクがさらに難しくなります。
この作業の目的は、一般的なテンプレートモデルを提案し、効率的なモーション計画および制御パイプラインを確立することにより、この課題に対処することを目的としています。
開始するために、縮小されたテンプレートモデルを提案します。デュアルレッグされた作動されたスプリング装備された逆振り子をトランク回転した回転 – 活性運動の作動からスプリング効果を分離することにより、並列コンプライアンスを明示的にモデル化します。
このテンプレートモデルでは、プロンキング、フロギージャンプ、ホップターンなどの汎用性の高いアクロバティックな動きは、特異性のない体の回転表現が考慮される二重層の軌道最適化によって生成されます。
線形の特異性のない追跡コントローラーと統合された拡張された四角形の移動が達成されます。
既存のテンプレートモデルとの比較により、モデルの精度と一般化の改善が明らかになります。
硬い四足動物と新しく設計された準拠の四角形を使用したハードウェア実験は、i)テンプレートモデルが多用途の動的運動を生成できることを示しています。
ii)平行弾力性は爆発的な動きを強化します。
たとえば、最大の留置距離、ホップターンヨー角、フロッグジャンプ距離は、それぞれ少なくとも25%、15%、25%増加します。
iii)並列弾力性により、モデリングエラーや外乱など、動的な不確実性に対する堅牢性が向上します。
たとえば、許容されるサポート表面の高さの変動は、堅牢なフロッグジャンプのために100%増加します。

要約(オリジナル)

Achieving versatile and explosive motion with robustness against dynamic uncertainties is a challenging task. Introducing parallel compliance in quadrupedal design is deemed to enhance locomotion performance, which, however, makes the control task even harder. This work aims to address this challenge by proposing a general template model and establishing an efficient motion planning and control pipeline. To start, we propose a reduced-order template model-the dual-legged actuated spring-loaded inverted pendulum with trunk rotation-which explicitly models parallel compliance by decoupling spring effects from active motor actuation. With this template model, versatile acrobatic motions, such as pronking, froggy jumping, and hop-turn, are generated by a dual-layer trajectory optimization, where the singularity-free body rotation representation is taken into consideration. Integrated with a linear singularity-free tracking controller, enhanced quadrupedal locomotion is achieved. Comparisons with the existing template model reveal the improved accuracy and generalization of our model. Hardware experiments with a rigid quadruped and a newly designed compliant quadruped demonstrate that i) the template model enables generating versatile dynamic motion; ii) parallel elasticity enhances explosive motion. For example, the maximal pronking distance, hop-turn yaw angle, and froggy jumping distance increase at least by 25%, 15% and 25%, respectively; iii) parallel elasticity improves the robustness against dynamic uncertainties, including modelling errors and external disturbances. For example, the allowable support surface height variation increases by 100% for robust froggy jumping.

arxiv情報

著者 Jiatao Ding,Peiyu Yang,Fabio Boekel,Jens Kober,Wei Pan,Matteo Saveriano,Cosimo Della Santina
発行日 2025-04-17 11:20:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Versatile, Robust, and Explosive Locomotion with Rigid and Articulated Compliant Quadrupeds はコメントを受け付けていません

3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise

要約

大規模な前提型ビジョンファンデーションモデルは、さまざまなビジョンタスクで重大な可能性を示しています。
ただし、産業用の異常検出の場合、実際の欠陥サンプルの希少性は、これらのモデルを活用する上で重大な課題をもたらします。
2D異常生成は確立された生成モデルで大幅に進歩しましたが、工業製造における3Dセンサーの採用により、表面品質検査のための3Dデータが新たな傾向になりました。
2D技術とは対照的に、3D異常生成はほとんど未踏のままであり、産業品質検査における3Dデータの可能性を制限しています。
このギャップに対処するために、Perlinノイズと表面パラメーター化に基づいて、斬新でシンプルな3D異常生成法3D-PNAを提案します。
私たちの方法は、ポイントクラウドを2D平面に投影し、Perlinノイズフィールドからマルチスケールノイズ値をサンプリングし、通常の方向に沿ってポイントクラウドを摂動することにより、現実的な3D表面異常を生成します。
包括的な視覚化実験を通じて、ノイズスケール、摂動強度、オクターブなどの重要なパラメーターが、生成された異常を細かく制御する方法を示し、発音された変形から微妙な表面変動までの多様な欠陥パターンの作成を可能にします。
さらに、我々のクロスカテゴリ実験は、この方法が、特定の表面特性に適応して、異なるオブジェクトタイプにわたって一貫した幾何学的にもっともらしい異常を生成することを示しています。
また、将来の研究を促進するために、包括的なコードベースと視覚化ツールキットも提供しています。

要約(オリジナル)

Large pretrained vision foundation models have shown significant potential in various vision tasks. However, for industrial anomaly detection, the scarcity of real defect samples poses a critical challenge in leveraging these models. While 2D anomaly generation has significantly advanced with established generative models, the adoption of 3D sensors in industrial manufacturing has made leveraging 3D data for surface quality inspection an emerging trend. In contrast to 2D techniques, 3D anomaly generation remains largely unexplored, limiting the potential of 3D data in industrial quality inspection. To address this gap, we propose a novel yet simple 3D anomaly generation method, 3D-PNAS, based on Perlin noise and surface parameterization. Our method generates realistic 3D surface anomalies by projecting the point cloud onto a 2D plane, sampling multi-scale noise values from a Perlin noise field, and perturbing the point cloud along its normal direction. Through comprehensive visualization experiments, we demonstrate how key parameters – including noise scale, perturbation strength, and octaves, provide fine-grained control over the generated anomalies, enabling the creation of diverse defect patterns from pronounced deformations to subtle surface variations. Additionally, our cross-category experiments show that the method produces consistent yet geometrically plausible anomalies across different object types, adapting to their specific surface characteristics. We also provide a comprehensive codebase and visualization toolkit to facilitate future research.

arxiv情報

著者 Yifeng Cheng,Juan Du
発行日 2025-04-17 11:23:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO, I.5.4 | 3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise はコメントを受け付けていません

Robotic Optimization of Powdered Beverages Leveraging Computer Vision and Bayesian Optimization

要約

食品業界における革新的な研究に対する需要の高まりは、製品の製造と評価の精度、複製、効率の向上を提供するため、大規模な実験でロボットの採用を促進しています。
この目的のために、ケーススタディとして粉末カプチーノの準備に焦点を当てた食品品質を最適化するために設計されたロボットシステムを導入します。
最適化アルゴリズムとコンピュータービジョンを活用することにより、ロボットはパラメーター空間を調査して、最適なフォーム品質のカプチーノを生成するための理想的な条件を特定します。
このシステムには、飲み物をさらに改善するために、閉ループ制御にコンピュータービジョン駆動型のフィードバックも組み込まれています。
私たちの調査結果は、高い再現性と広範なパラメーター探査を達成する上でロボットオートメーションの有効性を示し、より高度で信頼性の高い食品開発への道を開いています。

要約(オリジナル)

The growing demand for innovative research in the food industry is driving the adoption of robots in large-scale experimentation, as it offers increased precision, replicability, and efficiency in product manufacturing and evaluation. To this end, we introduce a robotic system designed to optimize food product quality, focusing on powdered cappuccino preparation as a case study. By leveraging optimization algorithms and computer vision, the robot explores the parameter space to identify the ideal conditions for producing a cappuccino with the best foam quality. The system also incorporates computer vision-driven feedback in a closed-loop control to further improve the beverage. Our findings demonstrate the effectiveness of robotic automation in achieving high repeatability and extensive parameter exploration, paving the way for more advanced and reliable food product development.

arxiv情報

著者 Emilia Szymanska,Josie Hughes
発行日 2025-04-17 11:24:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Robotic Optimization of Powdered Beverages Leveraging Computer Vision and Bayesian Optimization はコメントを受け付けていません

Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation

要約

触覚センシングは、操作タスクで人間レベルのロボット機能を達成するために重要です。
VBTSは有望なソリューションとして浮上しており、弾性ゲルパッドのカメラで飼育された変形パターンを介して接触を検知することにより、高い空間分解能と費用対効果を提供します。
ただし、これらのセンサーの複雑な物理的特性と視覚的な信号処理要件は、ロボットアプリケーションの独自の課題を示しています。
VBTの効率的で正確なシミュレーションツールの欠如により、触覚ロボット研究の規模と範囲が大幅に制限されています。
ここでは、IPCとABDをロボット、触覚センサー、オブジェクトを精度と前例のない速度の両方でモデル化する高性能シミュレーションプラットフォームであるTaccelを提示し、数千の並列環境でリアルタイムで18倍の加速を達成します。
並列化が制限されたサブリアルタイム速度で動作する以前のシミュレーターとは異なり、Taccelは正確な物理シミュレーションと現実的な触覚信号を提供し、ユーザーフレンドリーなAPIを通じて柔軟なロボットセンサー構成をサポートします。
オブジェクト認識、ロボット把握、および明確なオブジェクト操作の広範な検証を通じて、正確なシミュレーションとSIMからリアルへの転送の成功を示します。
これらの機能は、Taccelを触覚ロボティクスの研究開発を拡大するための強力なツールとして位置付けています。
大規模なシミュレーションと触覚センシングを使用した実験を可能にすることにより、Taccelはより有能なロボットシステムの開発を加速し、ロボットが物理的環境との相互作用と理解を潜在的に変換する可能性があります。

要約(オリジナル)

Tactile sensing is crucial for achieving human-level robotic capabilities in manipulation tasks. VBTSs have emerged as a promising solution, offering high spatial resolution and cost-effectiveness by sensing contact through camera-captured deformation patterns of elastic gel pads. However, these sensors’ complex physical characteristics and visual signal processing requirements present unique challenges for robotic applications. The lack of efficient and accurate simulation tools for VBTS has significantly limited the scale and scope of tactile robotics research. Here we present Taccel, a high-performance simulation platform that integrates IPC and ABD to model robots, tactile sensors, and objects with both accuracy and unprecedented speed, achieving an 18-fold acceleration over real-time across thousands of parallel environments. Unlike previous simulators that operate at sub-real-time speeds with limited parallelization, Taccel provides precise physics simulation and realistic tactile signals while supporting flexible robot-sensor configurations through user-friendly APIs. Through extensive validation in object recognition, robotic grasping, and articulated object manipulation, we demonstrate precise simulation and successful sim-to-real transfer. These capabilities position Taccel as a powerful tool for scaling up tactile robotics research and development. By enabling large-scale simulation and experimentation with tactile sensing, Taccel accelerates the development of more capable robotic systems, potentially transforming how robots interact with and understand their physical environment.

arxiv情報

著者 Yuyang Li,Wenxin Du,Chang Yu,Puhao Li,Zihang Zhao,Tengyu Liu,Chenfanfu Jiang,Yixin Zhu,Siyuan Huang
発行日 2025-04-17 12:57:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation はコメントを受け付けていません

Krysalis Hand: A Lightweight, High-Payload, 18-DoF Anthropomorphic End-Effector for Robotic Learning and Dexterous Manipulation

要約

このペーパーでは、Krysalisの手を紹介します。KrysalisHandは、軽量設計、高ペイロード容量、および多数の自由度(DOF)を組み合わせた5本指のロボットエンドエフェクターであり、産業用および研究環境の両方で器用な操作を可能にします。
この設計は、擬人化された形を維持しながら、アクチュエーターを手に統合します。
各指の関節には、アクティブな運動エンゲージメントなしで手が大きな外力を維持できるようにするセルフロックメカニズムがあります。
このアプローチは、ペイロード制限を運動強度から手の機械的強度にシフトし、より小さく、より費用対効果の高いモーターを使用できるようにします。
18 DOFと重量はわずか790グラムで、クリサリの手は指1個あたり10 nのアクティブな絞り力を供給し、10ポンドを超える受動的なペイロード容量をサポートします。
これらの特性により、クリサリスの手は、この種の最も軽く、強力で、最も器用なロボットエンドエフェクターの1つになります。
実験的評価では、複雑な操作タスクを実行し、重いペイロードを処理する能力を検証し、産業用アプリケーションと学術研究の可能性を強調しています。
制御とテレオタイズを含むクリサリの手に関連するすべてのコードは、プロジェクトGithubリポジトリ:https://github.com/soltanilara/krysalis_handで入手できます。

要約(オリジナル)

This paper presents the Krysalis Hand, a five-finger robotic end-effector that combines a lightweight design, high payload capacity, and a high number of degrees of freedom (DoF) to enable dexterous manipulation in both industrial and research settings. This design integrates the actuators within the hand while maintaining an anthropomorphic form. Each finger joint features a self-locking mechanism that allows the hand to sustain large external forces without active motor engagement. This approach shifts the payload limitation from the motor strength to the mechanical strength of the hand, allowing the use of smaller, more cost-effective motors. With 18 DoF and weighing only 790 grams, the Krysalis Hand delivers an active squeezing force of 10 N per finger and supports a passive payload capacity exceeding 10 lbs. These characteristics make Krysalis Hand one of the lightest, strongest, and most dexterous robotic end-effectors of its kind. Experimental evaluations validate its ability to perform intricate manipulation tasks and handle heavy payloads, underscoring its potential for industrial applications as well as academic research. All code related to the Krysalis Hand, including control and teleoperation, is available on the project GitHub repository: https://github.com/Soltanilara/Krysalis_Hand

arxiv情報

著者 Al Arsh Basheer,Justin Chang,Yuyang Chen,David Kim,Iman Soltani
発行日 2025-04-17 14:19:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Krysalis Hand: A Lightweight, High-Payload, 18-DoF Anthropomorphic End-Effector for Robotic Learning and Dexterous Manipulation はコメントを受け付けていません

Minimum-Violation Temporal Logic Planning for Heterogeneous Robots under Robot Skill Failures

要約

このホワイトペーパーでは、線形時間論的論理(LTL)フォーミュラによって記述された共同ミッションを担当する不均一なスキル(センシングや操作など)を備えたロボットのチームを検討します。
これらのLTLエンコードされたタスクでは、ロボットが時間的および論理的な順序で特定の地域とオブジェクトにスキルを適用する必要があります。
既存の時間論的計画アルゴリズムは、構成ごとの計画を合成することができますが、通常、ミッションパフォーマンスを損なう可能性のあるロボットスキルの予期しない障害に対する反応性が不足しています。
このペーパーでは、展開中に予期しない障害に適応するリアクティブLTL計画アルゴリズムを提案することにより、この課題に対処します。
具体的には、提案されたアルゴリズムは、機能スキルに基づいてサブタスクをロボットに再割り当てし、これらの新しい課題に対応し、ミッションの完了を確保するためにチームプランを局所的に修正します。
提案されたアルゴリズムの主な斬新さは、機能するロボットが限られているためにミッションの完了が不可能になるケースを処理する能力です。
ミッションの失敗を報告する代わりに、アルゴリズムは最も重要なサブタスクを戦略的に優先し、ユーザーが指定した優先事項に従って、ミッション違反を最小限に抑えるために、チームの計画を局所的に修正します。
提案されたフレームワークが最小限の侵害タスクの再割り当てとチームプランを計算する理論的条件を提供します。
提案された方法の効率を実証するために、数値およびハードウェアの実験を提供します。

要約(オリジナル)

In this paper, we consider teams of robots with heterogeneous skills (e.g., sensing and manipulation) tasked with collaborative missions described by Linear Temporal Logic (LTL) formulas. These LTL-encoded tasks require robots to apply their skills to specific regions and objects in a temporal and logical order. While existing temporal logic planning algorithms can synthesize correct-by-construction plans, they typically lack reactivity to unexpected failures of robot skills, which can compromise mission performance. This paper addresses this challenge by proposing a reactive LTL planning algorithm that adapts to unexpected failures during deployment. Specifically, the proposed algorithm reassigns sub-tasks to robots based on their functioning skills and locally revises team plans to accommodate these new assignments and ensure mission completion. The main novelty of the proposed algorithm is its ability to handle cases where mission completion becomes impossible due to limited functioning robots. Instead of reporting mission failure, the algorithm strategically prioritizes the most crucial sub-tasks and locally revises the team’s plans, as per user-specified priorities, to minimize mission violations. We provide theoretical conditions under which the proposed framework computes the minimum-violation task reassignments and team plans. We provide numerical and hardware experiments to demonstrate the efficiency of the proposed method.

arxiv情報

著者 Samarth Kalluraya,Beichen Zhou,Yiannis Kantaros
発行日 2025-04-17 14:40:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Minimum-Violation Temporal Logic Planning for Heterogeneous Robots under Robot Skill Failures はコメントを受け付けていません