From Structural Design to Dynamics Modeling: Control-Oriented Development of a 3-RRR Parallel Ankle Rehabilitation Robot

要約

このホワイトペーパーでは、ピッチ、ロール、およびヨーの動きを介したマルチドフリカバリをサポートする3-RRR球面並列メカニズム(SPM)に基づいたウェアラブルアンクルリハビリテーションロボットの開発を提示します。
このシステムは、快適さ、安全性、足首の生体力学との互換性のために設計されたコンパクトで人間工学に基づいた構造を備えています。
構造設計、モーション計画のための運動学的モデリング、トルク推定およびシミュレーション分析のためのラグランジアンベースの動的モデリングなど、完全なデザイン間パイプラインが実装されています。
予備シミュレーションは、代表的なリハビリテーション軌跡の下での安定した関節調整とスムーズなモーショントラッキングを検証します。
現在、コントロールフレームワークは、ワークスペース全体の応答性を高めるために開発されています。
将来の作業は、モデルベースの制御を介して運動学的特異性に対処するためのパーソナライズされたモデリングと適応戦略の統合に焦点を当てます。
この作業は、インテリジェントでパーソナライズされた足首リハビリテーションのための基礎プラットフォームを確立し、静的トレーニングと歩行期にタイミングされた支援の潜在的な拡張の両方を可能にします。

要約(オリジナル)

This paper presents the development of a wearable ankle rehabilitation robot based on a 3-RRR spherical parallel mechanism (SPM) to support multi-DOF recovery through pitch, roll, and yaw motions. The system features a compact, ergonomic structure designed for comfort, safety, and compatibility with ankle biomechanics. A complete design-to-dynamics pipeline has been implemented, including structural design, kinematic modeling for motion planning, and Lagrangian-based dynamic modeling for torque estimation and simulation analysis. Preliminary simulations verify stable joint coordination and smooth motion tracking under representative rehabilitation trajectories. The control framework is currently being developed to enhance responsiveness across the workspace. Future work will focus on integrating personalized modeling and adaptive strategies to address kinematic singularities through model based control. This work establishes a foundational platform for intelligent, personalized ankle rehabilitation, enabling both static training and potential extension to gait-phase-timed assistance.

arxiv情報

著者 Siyuan Zhang,Yufei Zhang,Junlin Lyu,Sunil K. Agrawal
発行日 2025-05-30 21:11:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | From Structural Design to Dynamics Modeling: Control-Oriented Development of a 3-RRR Parallel Ankle Rehabilitation Robot はコメントを受け付けていません

Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory

要約

自律運転(AD)知覚モデルの一般化を改善するには、継続的に収集されたデータに基づいて、時間の経過とともにモデルを更新する必要があります。
時間が進むにつれて、ADモデルが適合するデータの量が拡大し、ADモデルの一般化を大幅に改善するのに役立ちます。
ただし、このような拡大し続けるデータは、ADモデルの両刃の剣です。
具体的には、適合データ量がADモデルのフィッティング容量を超えるようになると、ADモデルは不十分になりやすくなります。
この問題に対処するために、ADセマンティック情報を理解するために、下流の知覚ヘッドと相まってバックボーンとして、前処理された大型ビジョンモデル(LVM)を使用することを提案します。
この設計は、LVMの強力なフィッティング機能により、前述の不足していない問題を乗り越えるだけでなく、LVMSの広大で多様なトレーニングデータのおかげで認識の一般化を強化することもできます。
一方、LVMバックボーンを実行しながら知覚ヘッドをトレーニングするという車両の計算負担を軽減するために、収束を加速するために事後最適化軌道(POT)ガイド最適化スキーム(POTGUI)を導入します。
具体的には、ポットジェネレーター(POTGEN)を提案して、事前に事後(将来)最適化方向を生成して、モデルが一般に10エポック内に収束できる現在の最適化反復を導きます。
広範な実験は、提案された方法がパフォーマンスを66.48 \%以上改善し、既存の最先端のアプローチと比較して6倍以上に収束することを示しています。

要約(オリジナル)

To improve the generalization of the autonomous driving (AD) perception model, vehicles need to update the model over time based on the continuously collected data. As time progresses, the amount of data fitted by the AD model expands, which helps to improve the AD model generalization substantially. However, such ever-expanding data is a double-edged sword for the AD model. Specifically, as the fitted data volume grows to exceed the the AD model’s fitting capacities, the AD model is prone to under-fitting. To address this issue, we propose to use a pretrained Large Vision Models (LVMs) as backbone coupled with downstream perception head to understand AD semantic information. This design can not only surmount the aforementioned under-fitting problem due to LVMs’ powerful fitting capabilities, but also enhance the perception generalization thanks to LVMs’ vast and diverse training data. On the other hand, to mitigate vehicles’ computational burden of training the perception head while running LVM backbone, we introduce a Posterior Optimization Trajectory (POT)-Guided optimization scheme (POTGui) to accelerate the convergence. Concretely, we propose a POT Generator (POTGen) to generate posterior (future) optimization direction in advance to guide the current optimization iteration, through which the model can generally converge within 10 epochs. Extensive experiments demonstrate that the proposed method improves the performance by over 66.48\% and converges faster over 6 times, compared to the existing state-of-the-art approach.

arxiv情報

著者 Wei-Bin Kou,Qingfeng Lin,Ming Tang,Jingreng Lei,Shuai Wang,Rongguang Ye,Guangxu Zhu,Yik-Chung Wu
発行日 2025-05-30 23:06:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | Enhancing Large Vision Model in Street Scene Semantic Understanding through Leveraging Posterior Optimization Trajectory はコメントを受け付けていません

Extended Set-based Tasks for Multi-task Execution and Prioritization

要約

複数のタスクを同時に実行する能力は、冗長なロボットシステムの重要な機能です。
実際のところ、複数のタスクの実行の結果として複雑な動作を取得できることがよくあります。
さらに、安全性の高いアプリケーションでは、ロボットとその周辺の安全性を確実に保証するために設計されたタスクを他の名目上のタスクとともに実行する必要があります。
そのような場合、後者よりも前者に優先順位を付けることも重要です。
このホワイトペーパーでは、拡張されたセットベースのタスクの定義、つまり、タスクスペースのサブセットを漸近的に安定したものにするか、制御バリア関数を使用して前方に不変をレンダリングすることで実行できるタスクを形式化します。
運動学的および動的ロボットモデルを使用して、より複雑で時間変化する優先順位付けされたタスクのスタックの実行を可能にする、このようなタスクの正式な数学的表現を提案します。
計算上効率的で、入力境界を説明し、拡張セットベースのタスクの時変優先型スタックの安定した実行を可能にする最適化ベースのフレームワークを提示します。
提案されたフレームワークは、広範なシミュレーション、最先端の階層的二次プログラミングとの定量的比較、およびロボットマニピュレーターの実験を使用して検証されます。

要約(オリジナル)

The ability of executing multiple tasks simultaneously is an important feature of redundant robotic systems. As a matter of fact, complex behaviors can often be obtained as a result of the execution of several tasks. Moreover, in safety-critical applications, tasks designed to ensure the safety of the robot and its surroundings have to be executed along with other nominal tasks. In such cases, it is also important to prioritize the former over the latter. In this paper, we formalize the definition of extended set-based tasks, i.e., tasks which can be executed by rendering subsets of the task space asymptotically stable or forward invariant using control barrier functions. We propose a formal mathematical representation of such tasks that allows for the execution of more complex and time-varying prioritized stacks of tasks using kinematic and dynamic robot models alike. We present an optimization-based framework which is computationally efficient, accounts for input bounds, and allows for the stable execution of time-varying prioritized stacks of extended set-based tasks. The proposed framework is validated using extensive simulations, quantitative comparisons to the state-of-the-art hierarchical quadratic programming, and experiments with robotic manipulators.

arxiv情報

著者 Gennaro Notomista,Mario Selvaggio,Francesca Pagano,María Santos,Siddharth Mayya,Vincenzo Lippiello,Cristian Secchi
発行日 2025-05-30 23:35:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | Extended Set-based Tasks for Multi-task Execution and Prioritization はコメントを受け付けていません

SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation

要約

正確な機器のポーズ推定は、ロボット手術の将来に向けた重要なステップであり、自律外の手術タスクの実行などのアプリケーションを可能にします。
手術器具のポーズ推定のための視覚ベースの方法は、ツール追跡に対する実用的なアプローチを提供しますが、多くの場合、機器にマーカーを取り付ける必要があります。
最近、より多くの研究が、深い学習に基づいたマーカーのない方法の開発に焦点を当てています。
ただし、深い学習トレーニングに必要なグラウンドトゥルースインストゥルメントポーズを使用して、現実的な外科データを取得することは困難です。
手術機器のポーズ推定における問題に対処するために、2023年に医療画像コンピューティングとコンピューター支援介入に関する第26回国際会議とコンピューター支援介入(MICCAI)でホストされた外科ロボット計器ポーズ推定(Surgripe)チャレンジを導入します。この課題の目的は次のとおりです。
推定方法。
この課題は、既存の方法に対する精度と堅牢性の向上を示すいくつかの新しいアルゴリズムの開発につながりました。
Surgripe Datasetのパフォーマンス評価調査では、これらの高度なアルゴリズムがロボット手術システムに統合される可能性を強調し、より正確で自律的な外科的処置への道を開いています。
Surgripe Challengeは、この分野の新しいベンチマークを正常に確立し、外科ロボット計器の推定におけるさらなる研究開発を促進しました。

要約(オリジナル)

Accurate instrument pose estimation is a crucial step towards the future of robotic surgery, enabling applications such as autonomous surgical task execution. Vision-based methods for surgical instrument pose estimation provide a practical approach to tool tracking, but they often require markers to be attached to the instruments. Recently, more research has focused on the development of marker-less methods based on deep learning. However, acquiring realistic surgical data, with ground truth instrument poses, required for deep learning training, is challenging. To address the issues in surgical instrument pose estimation, we introduce the Surgical Robot Instrument Pose Estimation (SurgRIPE) challenge, hosted at the 26th International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI) in 2023. The objectives of this challenge are: (1) to provide the surgical vision community with realistic surgical video data paired with ground truth instrument poses, and (2) to establish a benchmark for evaluating markerless pose estimation methods. The challenge led to the development of several novel algorithms that showcased improved accuracy and robustness over existing methods. The performance evaluation study on the SurgRIPE dataset highlights the potential of these advanced algorithms to be integrated into robotic surgery systems, paving the way for more precise and autonomous surgical procedures. The SurgRIPE challenge has successfully established a new benchmark for the field, encouraging further research and development in surgical robot instrument pose estimation.

arxiv情報

著者 Haozheng Xu,Alistair Weld,Chi Xu,Alfie Roddan,Joao Cartucho,Mert Asim Karaoglu,Alexander Ladikos,Yangke Li,Yiping Li,Daiyun Shen,Geonhee Lee,Seyeon Park,Jongho Shin,Young-Gon Kim,Lucy Fothergill,Dominic Jones,Pietro Valdastri,Duygu Sarikaya,Stamatia Giannarou
発行日 2025-05-31 00:48:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation はコメントを受け付けていません

Task-Optimized Convolutional Recurrent Networks Align with Tactile Processing in the Rodent Brain

要約

触覚センシングは、視覚や言語などのより成熟したモダリティと比較して、神経科学ではあまり理解されておらず、人工システムではあまり効果的ではありません。
これらのギャップは、新しいエンコーダーアテンダーデコーダー(EAD)フレームワークを導入して、カスタマイズされたげっ歯類ウィスカアレイシミュレーターから現実的な触覚入力シーケンスを訓練するタスク最適化された時間ニューラルネットワークの空間を体系的に調査します。
触覚分類のための純粋なフィードフォワードおよび状態空間アーキテクチャに対する優れたエンコーダーとして、畳み込みの再発性ニューラルネットワーク(CONBRNNS)を特定します。
重要なことに、これらのConvrnn-EncoderベースのEADモデルは、神経表現を密接に一致させるげっ歯類の体性感覚皮質を達成し、説明可能な神経変動性を飽和させ、監視された分類パフォーマンスと神経整列との明確な線形関係を明らかにします。
さらに、触覚固有の増強で訓練された対照的な自己監督の統合条件ベースのEADは、監視されたニューラルフィットを一致させ、エトロジーに関連するラベルのないプロキシとして機能します。
神経科学の場合、我々の発見は、体性感覚皮質の汎用触覚表現に重要であると非線形再発処理を強調し、このシステムの基礎となる誘導バイアスの最初の定量的特性評価を提供します。
具体化されたAIの場合、我々の結果は、現実的な触覚入力を処理するための再発性EADアーキテクチャの重要性と、構造化されていない環境で感覚を感じるのと同じタイプのセンサーを使用して、堅牢な触覚知覚を達成するための調整された自己監視学習方法を強調しています。

要約(オリジナル)

Tactile sensing remains far less understood in neuroscience and less effective in artificial systems compared to more mature modalities such as vision and language. We bridge these gaps by introducing a novel Encoder-Attender-Decoder (EAD) framework to systematically explore the space of task-optimized temporal neural networks trained on realistic tactile input sequences from a customized rodent whisker-array simulator. We identify convolutional recurrent neural networks (ConvRNNs) as superior encoders to purely feedforward and state-space architectures for tactile categorization. Crucially, these ConvRNN-encoder-based EAD models achieve neural representations closely matching rodent somatosensory cortex, saturating the explainable neural variability and revealing a clear linear relationship between supervised categorization performance and neural alignment. Furthermore, contrastive self-supervised ConvRNN-encoder-based EADs, trained with tactile-specific augmentations, match supervised neural fits, serving as an ethologically-relevant, label-free proxy. For neuroscience, our findings highlight nonlinear recurrent processing as important for general-purpose tactile representations in somatosensory cortex, providing the first quantitative characterization of the underlying inductive biases in this system. For embodied AI, our results emphasize the importance of recurrent EAD architectures to handle realistic tactile inputs, along with tailored self-supervised learning methods for achieving robust tactile perception with the same type of sensors animals use to sense in unstructured environments.

arxiv情報

著者 Trinity Chung,Yuchen Shen,Nathan C. L. Kong,Aran Nayebi
発行日 2025-05-31 03:47:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, q-bio.NC | Task-Optimized Convolutional Recurrent Networks Align with Tactile Processing in the Rodent Brain はコメントを受け付けていません

View-Invariant Policy Learning via Zero-Shot Novel View Synthesis

要約

大規模な視覚運動政策学習は、一般化可能な操作システムの開発に向けた有望なアプローチです。
しかし、多様な実施形態、環境、および観察モダリティに基づいて展開できるポリシーは、とらえどころのないままです。
この作業では、世界の大規模な視覚データからの知識を使用して、一般化可能な操作のための1つの軸に対処するためにどのように使用できるかを調査します。
具体的には、単一のカメラビューポイントから同じシーンの画像を単一の入力画像を与えられた場合にレンダリングすることにより、3Dにアウェアのシーンレベルの事前に学習する単一画像の新規ビュー合成モデルを研究します。
多様なロボットデータへの実用的なアプリケーションのために、これらのモデルはゼロショットを動作させ、目に見えないタスクと環境でビュー合成を実行する必要があります。
ビュー合成拡張(Vista)を呼び出す単純なデータの高度制度内のビュー合成モデルを経験的に分析して、シングルビューポイントデモンストレーションデータから視点に不変のポリシーを学習する能力を理解します。
分散型カメラの視点に向けて方法で訓練されたポリシーの堅牢性を評価すると、シミュレートされた操作タスクと実際の操作タスクの両方でベースラインを上回ることがわかります。
ビデオと追加の視覚化は、https://s-tian.github.io/projects/vistaで入手できます。

要約(オリジナル)

Large-scale visuomotor policy learning is a promising approach toward developing generalizable manipulation systems. Yet, policies that can be deployed on diverse embodiments, environments, and observational modalities remain elusive. In this work, we investigate how knowledge from large-scale visual data of the world may be used to address one axis of variation for generalizable manipulation: observational viewpoint. Specifically, we study single-image novel view synthesis models, which learn 3D-aware scene-level priors by rendering images of the same scene from alternate camera viewpoints given a single input image. For practical application to diverse robotic data, these models must operate zero-shot, performing view synthesis on unseen tasks and environments. We empirically analyze view synthesis models within a simple data-augmentation scheme that we call View Synthesis Augmentation (VISTA) to understand their capabilities for learning viewpoint-invariant policies from single-viewpoint demonstration data. Upon evaluating the robustness of policies trained with our method to out-of-distribution camera viewpoints, we find that they outperform baselines in both simulated and real-world manipulation tasks. Videos and additional visualizations are available at https://s-tian.github.io/projects/vista.

arxiv情報

著者 Stephen Tian,Blake Wulfe,Kyle Sargent,Katherine Liu,Sergey Zakharov,Vitor Guizilini,Jiajun Wu
発行日 2025-05-31 05:58:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | View-Invariant Policy Learning via Zero-Shot Novel View Synthesis はコメントを受け付けていません

LP-ICP: General Localizability-Aware Point Cloud Registration for Robust Localization in Extreme Unstructured Environments

要約

反復的な近くのポイント(ICP)アルゴリズムは、LIDARベースのSLAMアルゴリズムの重要なコンポーネントです。
ただし、そのパフォーマンスは、特徴と幾何学的構造を欠く非構造化された環境で悪影響を受ける可能性があり、局在化とマッピングの精度が低く、堅牢性が低くなります。
幾何学的制約の欠如によって引き起こされる退化性は、条件付き方向に沿った6-DOFポーズ推定でエラーにつながる可能性があることが知られています。
したがって、より広く、より微細な変性検出および取り扱い方法が必要です。
このペーパーでは、ICPアルゴリズムのポイントツーラインとポイントツープレーンの距離メトリックを組み合わせた新しいポイントクラウド登録フレームワークLP-ICPを提案し、ローカライズ性の検出と取り扱いを提案します。
LP-ICPは、ポイントツー面のローカル化可能性情報のみに依存するのではなく、ポイントツーラインメトリックを組み込んでローカライズ性分析を強化し、それにより豊かな幾何学的制約を活用します。
ローカライズ性検出モジュールと最適化モジュールで構成されています。
ローカライズ可能性検出モジュールは、スキャンとマップ間の平面に対して、エッジポイント(ローカル滑らかさが低い)と平面ポイント(局所的な滑らかさが高い)間の対応を利用することにより、ローカライズ性分析を実行します。
個々の対応制約のローカライズ性の寄与は、より広い範囲に適用できます。
最適化モジュールは、ローカル化可能性カテゴリに基づいて、最適化方程式に追加のソフトとハード制約を追加します。
これにより、ポーズを条件付きの指示に沿って制約することができます。
提案された方法は、シミュレーションおよび実際のデータセットで評価され、テストされたシナリオの最先端の方法よりも同等またはより良い精度を示しています。
部分的にローカライズ可能な方向で観察された変動は、堅牢性と一般化性に関するさらなる調査の必要性を示唆しています。

要約(オリジナル)

The Iterative Closest Point (ICP) algorithm is a crucial component of LiDAR-based SLAM algorithms. However, its performance can be negatively affected in unstructured environments that lack features and geometric structures, leading to low accuracy and poor robustness in localization and mapping. It is known that degeneracy caused by the lack of geometric constraints can lead to errors in 6-DOF pose estimation along ill-conditioned directions. Therefore, there is a need for a broader and more fine-grained degeneracy detection and handling method. This paper proposes a new point cloud registration framework, LP-ICP, that combines point-to-line and point-to-plane distance metrics in the ICP algorithm, with localizability detection and handling. Rather than relying solely on point-to-plane localizability information, LP-ICP enhances the localizability analysis by incorporating a point-to-line metric, thereby exploiting richer geometric constraints. It consists of a localizability detection module and an optimization module. The localizability detection module performs localizability analysis by utilizing the correspondences between edge points (with low local smoothness) to lines and planar points (with high local smoothness) to planes between the scan and the map. The localizability contribution of individual correspondence constraints can be applied to a broader range. The optimization module adds additional soft and hard constraints to the optimization equations based on the localizability category. This allows the pose to be constrained along ill-conditioned directions. The proposed method is evaluated on simulation and real-world datasets, showing comparable or better accuracy than the state-of-the art methods in tested scenarios. Observed variations in partially localizable directions suggest the need for further investigation on robustness and generalizability.

arxiv情報

著者 Haosong Yue,Qingyuan Xu,Fei Chen,Jia Pan,Weihai Chen
発行日 2025-05-31 06:36:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LP-ICP: General Localizability-Aware Point Cloud Registration for Robust Localization in Extreme Unstructured Environments はコメントを受け付けていません

Active Multi-task Policy Fine-tuning

要約

事前に訓練されたジェネラリストの政策は、斬新でドメイン内のタスクへの迅速な適応の約束のために、ロボット学習に急速に関連性を獲得しています。
この適応は、多くの場合、関心のある特定のタスクのために新しいデモンストレーションを収集し、行動のクローニングなどの模倣学習アルゴリズムを適用することに依存しています。
ただし、いくつかのタスクを学習する必要があるとすぐに、どのタスクを実証する必要があるか、どのくらいの頻度で決定する必要がありますか?
このマルチタスクの問題を調査し、エージェントが実証されるタスクを適応的に選択するインタラクティブなフレームワークを調査します。
AMF(Active Multi-Task微調整)を提案します。これは、エキスパートポリシーに関する最大の情報ゲインをもたらすデモンストレーションを収集することにより、限られたデモ予算の下でマルチタスクポリシーパフォーマンスを最大化するアルゴリズムです。
規則性の仮定の下でAMFのパフォーマンス保証を導き出し、複雑で高次元の環境での神経政策を効率的に微調整するための経験的有効性を実証します。

要約(オリジナル)

Pre-trained generalist policies are rapidly gaining relevance in robot learning due to their promise of fast adaptation to novel, in-domain tasks. This adaptation often relies on collecting new demonstrations for a specific task of interest and applying imitation learning algorithms, such as behavioral cloning. However, as soon as several tasks need to be learned, we must decide which tasks should be demonstrated and how often? We study this multi-task problem and explore an interactive framework in which the agent adaptively selects the tasks to be demonstrated. We propose AMF (Active Multi-task Fine-tuning), an algorithm to maximize multi-task policy performance under a limited demonstration budget by collecting demonstrations yielding the largest information gain on the expert policy. We derive performance guarantees for AMF under regularity assumptions and demonstrate its empirical effectiveness to efficiently fine-tune neural policies in complex and high-dimensional environments.

arxiv情報

著者 Marco Bagatella,Jonas Hübotter,Georg Martius,Andreas Krause
発行日 2025-05-31 10:53:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Active Multi-task Policy Fine-tuning はコメントを受け付けていません

Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy

要約

ロボット操作における人間の指示の考えられない実行は、中毒、火災、さらには爆発などの深刻な安全リスクにつながる可能性があります。
この論文では、責任あるロボット操作を提示します。これは、指示を完了し、複雑な操作を安全かつ効率的に実行しながら、現実世界の環境で潜在的な危険を考慮する必要があります。
ただし、現実世界のこのようなシナリオは、トレーニングにとってさまざまで危険です。
この課題に対処するために、(i)安全リスクを含むシナリオを自動的に生成し、仮想相互作用を実行する世界モデルを含む、(ii)安全性の結果を推測し、安全性の認知を徐々に発展させ、ロボットがデンジャーをnavavedしながらタスクを達成できるようにする精神モデルを含む、ポリティとしての安全性を提案します。
さらに、SafeBox合成データセットを作成します。これには、さまざまな安全リスクシナリオと指示を備えた100の責任あるロボット操作タスクが含まれ、実際の実験に関連するリスクを効果的に削減します。
実験は、安全性としての安全性がリスクを回避し、合成データセットと実際の世界の実験の両方で効率的にタスクを完了し、ベースライン方法を大幅に上回ることを示しています。
SafeBoxデータセットは、現実世界のシナリオで一貫した評価結果を示し、将来の研究の安全で効果的なベンチマークとして機能します。

要約(オリジナル)

Unthinking execution of human instructions in robotic manipulation can lead to severe safety risks, such as poisonings, fires, and even explosions. In this paper, we present responsible robotic manipulation, which requires robots to consider potential hazards in the real-world environment while completing instructions and performing complex operations safely and efficiently. However, such scenarios in real world are variable and risky for training. To address this challenge, we propose Safety-as-policy, which includes (i) a world model to automatically generate scenarios containing safety risks and conduct virtual interactions, and (ii) a mental model to infer consequences with reflections and gradually develop the cognition of safety, allowing robots to accomplish tasks while avoiding dangers. Additionally, we create the SafeBox synthetic dataset, which includes one hundred responsible robotic manipulation tasks with different safety risk scenarios and instructions, effectively reducing the risks associated with real-world experiments. Experiments demonstrate that Safety-as-policy can avoid risks and efficiently complete tasks in both synthetic dataset and real-world experiments, significantly outperforming baseline methods. Our SafeBox dataset shows consistent evaluation results with real-world scenarios, serving as a safe and effective benchmark for future research.

arxiv情報

著者 Minheng Ni,Lei Zhang,Zihan Chen,Kaixin Bai,Zhaopeng Chen,Jianwei Zhang,Lei Zhang,Wangmeng Zuo
発行日 2025-05-31 11:19:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation via Safety-as-Policy はコメントを受け付けていません

Action-Gradient Monte Carlo Tree Search for Non-Parametric Continuous (PO)MDPs

要約

継続的な状態、アクション、および観測スペースで動作する自律システムは、不確実性の下で計画と推論を必要とします。
このようなPOMDPの既存のオンライン計画方法は、ほぼ排他的にサンプルベースですが、それをモンテカルロツリー検索(MCTS)に組み合わせるため、特にノンパラメトリック設定では困難であることが判明したため、高次元勾配の最適化の力が明らかになります。
このギャップは、3つの貢献で閉じます。
まず、MDPとPOMDPの両方に対して移行尤度の観点から、新しいアクション勾配の定理を導き出し、勾配情報をツリー検索中にアクセスできるようにします。
第二に、アクションブランチを変更するためにサンプルを再利用する複数の重要性サンプリング(MIS)ツリーを導入し、検索内の勾配ステップを可能にする一貫した値推定値をもたらします。
第三に、独立した関心の結果、物理ドメインで一般的なスムーズな生成モデルのために、エリア式を介して正確な遷移確率計算を導き出します。
これらの要素は、非パラメトリック粒子検索とPOMDPでのオンライン勾配洗練をブレンドする最初のプランナーであるアクショングレードのモンテカルロツリー検索(AGMCT)に結合します。
いくつかの挑戦的な連続MDPおよびPOMDPベンチマークにまたがるAGMCTは、ソリューション品質の広く使用されているサンプルのみのソルバーを上回ります。

要約(オリジナル)

Autonomous systems that operate in continuous state, action, and observation spaces require planning and reasoning under uncertainty. Existing online planning methods for such POMDPs are almost exclusively sample-based, yet they forego the power of high-dimensional gradient optimization as combining it into Monte Carlo Tree Search (MCTS) has proved difficult, especially in non-parametric settings. We close this gap with three contributions. First, we derive a novel action-gradient theorem for both MDPs and POMDPs in terms of transition likelihoods, making gradient information accessible during tree search. Second, we introduce the Multiple Importance Sampling (MIS) tree, that re-uses samples for changing action branches, yielding consistent value estimates that enable in-search gradient steps. Third, we derive exact transition probability computation via the area formula for smooth generative models common in physical domains, a result of independent interest. These elements combine into Action-Gradient Monte Carlo Tree Search (AGMCTS), the first planner to blend non-parametric particle search with online gradient refinement in POMDPs. Across several challenging continuous MDP and POMDP benchmarks, AGMCTS outperforms widely-used sample-only solvers in solution quality.

arxiv情報

著者 Idan Lev-Yehudi,Michael Novitsky,Moran Barenboim,Ron Benchetrit,Vadim Indelman
発行日 2025-05-31 11:36:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Action-Gradient Monte Carlo Tree Search for Non-Parametric Continuous (PO)MDPs はコメントを受け付けていません