corobos: A Design for Mobile Robots Enabling Cooperative Transitions between Table and Wall Surfaces

要約

SWARMユーザーインターフェイスにより、複数のモバイルロボットを使用してユーザー環境の動的配置が可能になりますが、通常、2輪推進システムによって課される制約のため、その動作範囲は通常、単一の平面に限定されます。
これらのロボットが、人間の介入なしに、これらのロボットがテーブル(水平)と壁(垂直)の表面をシームレスに協力的に移行できるようにする概念実証設計であるCorobosを提示します。
各ロボットには、別のロボットがターゲットサーフェスに向かってプッシュすると、滑らかな回転を促進するユニークに設計された勾配構造が装備されています。
特に、この設計は受動的な機械的要素のみに依存しており、追加のアクティブな電気部品の必要性を排除します。
この構造の設計パラメーターを調査し、実験を通じて遷移成功率を評価しました。
さらに、ユーザー環境の強化におけるコロボの可能性を紹介するためのさまざまなアプリケーションの例を示します。

要約(オリジナル)

Swarm User Interfaces allow dynamic arrangement of user environments through the use of multiple mobile robots, but their operational range is typically confined to a single plane due to constraints imposed by their two-wheel propulsion systems. We present corobos, a proof-of-concept design that enables these robots to cooperatively transition between table (horizontal) and wall (vertical) surfaces seamlessly, without human intervention. Each robot is equipped with a uniquely designed slope structure that facilitates smooth rotation when another robot pushes it toward a target surface. Notably, this design relies solely on passive mechanical elements, eliminating the need for additional active electrical components. We investigated the design parameters of this structure and evaluated its transition success rate through experiments. Furthermore, we demonstrate various application examples to showcase the potential of corobos in enhancing user environments.

arxiv情報

著者 Changyo Han,Yosuke Nakagawa,Takeshi Naemura
発行日 2025-02-25 05:42:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | corobos: A Design for Mobile Robots Enabling Cooperative Transitions between Table and Wall Surfaces はコメントを受け付けていません

FetchBot: Object Fetching in Cluttered Shelves via Zero-Shot Sim2Real

要約

散らかった棚から取得するオブジェクトは、現実世界のシナリオで人間を支援するロボットにとって重要な能力です。
このタスクを達成するには、周囲のオブジェクトへの妨害を最小限に抑えることにより、安全性を優先するロボットの動作が必要です。これは、制限されたモーションスペース、視野の制限、および複雑なオブジェクトのダイナミクスによる本質的ではあるが非常に困難な要件です。
このペーパーでは、ゼロショットの一般化可能なオブジェクトを実世界の設定で散らかった棚から取得できるように設計されたSIMからリアルのフレームワークであるFetchBotを紹介します。
データ不足に対処するために、多様なシミュレートされた乱雑な棚シーンを大規模に生成するための効率的なボクセルベースの方法を提案し、これらのシーン内でオブジェクトを取得する軌跡を取得するためのダイナミクスを認識した強化学習(RL)ポリシーを訓練します。
Oracle情報を活用するこのRLポリシーは、その後、実際の展開のためのビジョンベースのポリシーに蒸留されます。
Sim-to-Realの矛盾は、ほとんどの場合、幾何学的な寸法からのテクスチャの変動に起因することを考慮して、SIMベースのポリシーの入力としてSIM-to-Realギャップを緩和するための入力として、本格的な深度基礎モデルによって推定される深度情報を採用することを提案します。

限られたビューの課題に取り組むために、マルチビュー表現を学習するための新しいアーキテクチャを設計し、散らかった棚シーンの包括的なエンコードを可能にします。
これにより、FetchBotはさまざまな位置や深さからオブジェクトをフェッチしながら衝突を効果的に最小限に抑え、堅牢で安全性の高い操作を確保できます。
シミュレーションとリアルロボットの両方の実験は、特に幅広い現実世界のシナリオを処理する際に、Fetchbotの優れた一般化能力を示しています。

要約(オリジナル)

Object fetching from cluttered shelves is an important capability for robots to assist humans in real-world scenarios. Achieving this task demands robotic behaviors that prioritize safety by minimizing disturbances to surrounding objects, an essential but highly challenging requirement due to restricted motion space, limited fields of view, and complex object dynamics. In this paper, we introduce FetchBot, a sim-to-real framework designed to enable zero-shot generalizable and safety-aware object fetching from cluttered shelves in real-world settings. To address data scarcity, we propose an efficient voxel-based method for generating diverse simulated cluttered shelf scenes at scale and train a dynamics-aware reinforcement learning (RL) policy to generate object fetching trajectories within these scenes. This RL policy, which leverages oracle information, is subsequently distilled into a vision-based policy for real-world deployment. Considering that sim-to-real discrepancies stem from texture variations mostly while from geometric dimensions rarely, we propose to adopt depth information estimated by full-fledged depth foundation models as the input for the vision-based policy to mitigate sim-to-real gap. To tackle the challenge of limited views, we design a novel architecture for learning multi-view representations, allowing for comprehensive encoding of cluttered shelf scenes. This enables FetchBot to effectively minimize collisions while fetching objects from varying positions and depths, ensuring robust and safety-aware operation. Both simulation and real-robot experiments demonstrate FetchBot’s superior generalization ability, particularly in handling a broad range of real-world scenarios, includ

arxiv情報

著者 Weiheng Liu,Yuxuan Wan,Jilong Wang,Yuxuan Kuang,Xuesong Shi,Haoran Li,Dongbin Zhao,Zhizheng Zhang,He Wang
発行日 2025-02-25 06:32:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | FetchBot: Object Fetching in Cluttered Shelves via Zero-Shot Sim2Real はコメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

要約

報酬形状は、特にまばらな報酬が学習を妨げる複雑なタスクでは、強化学習(RL)で重要です。
ただし、一連の報酬機能を計算上効率的な方法で効果的に形作る報酬を選択することは、オープンな課題のままです。
オンラインモデル選択の問題として報酬機能の選択を構成する斬新なアプローチであるオンライン報酬選択とポリシー最適化(ORSO)を提案します。
Orsoは、人間の介入なしにパフォーマンスを形作る報酬機能を自動的に識別し、証明された後悔の保証を受けています。
さまざまな連続制御タスクにわたるORSOの有効性を示します。
以前のアプローチと比較して、シェーピング報酬関数を評価するために必要なデータの量を大幅に削減し、その結果、優れたデータ効率と計算時間が大幅に短縮されます(最大8倍)。
ORSOは、以前の方法を50%以上上回る高品質の報酬関数を一貫して識別し、平均して、ドメインの専門家による手動で設計された報酬関数を使用して学習したものと同じようにパフォーマンスを特定します。

要約(オリジナル)

Reward shaping is critical in reinforcement learning (RL), particularly for complex tasks where sparse rewards can hinder learning. However, choosing effective shaping rewards from a set of reward functions in a computationally efficient manner remains an open challenge. We propose Online Reward Selection and Policy Optimization (ORSO), a novel approach that frames the selection of shaping reward function as an online model selection problem. ORSO automatically identifies performant shaping reward functions without human intervention with provable regret guarantees. We demonstrate ORSO’s effectiveness across various continuous control tasks. Compared to prior approaches, ORSO significantly reduces the amount of data required to evaluate a shaping reward function, resulting in superior data efficiency and a significant reduction in computational time (up to 8 times). ORSO consistently identifies high-quality reward functions outperforming prior methods by more than 50% and on average identifies policies as performant as the ones learned using manually engineered reward functions by domain experts.

arxiv情報

著者 Chen Bo Calvin Zhang,Zhang-Wei Hong,Aldo Pacchiano,Pulkit Agrawal
発行日 2025-02-25 06:45:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization はコメントを受け付けていません

Orchestrated Robust Controller for Precision Control of Heavy-duty Hydraulic Manipulators

要約

大規模な産業投資と、頑丈な油圧マニピュレーターに関する学術研究の増加は、自動化への道を避けられないほど舗装し、堅牢で高精度コントローラーの設計を必要とします。
この研究では、組織化された堅牢なコントローラーが、擬人化された腕と球形の手首を持つ一般的なマニピュレーターの上記の問題に対処するように設計されています。
仮想分解制御(VDC)のおかげで、ロボットシステム全体がサブシステムに分解され、不明なモデルの不確実性、未知の妨害、および複合入力の非線形性を考慮することにより、各ローカルサブシステムで堅牢なコントローラーが設計されています。
そのため、放射状の基本関数ニューラルネットワーク(RBFNNS)がVDCに組み込まれて、未知の妨害と不確実性に取り組み、新しい分散型RBFNNSをもたらします。
各ローカルサブシステムで設計されたすべての堅牢なローカルコントローラーは、高精度制御を達成するために調整されます。
最終的に、VDCのコンテキストで初めて、設計されたコントローラーの下で半glob的に均一に究極の境界が達成されます。
理論的結果の妥当性は、5メートルのリーチで600 kgの公称リフティング容量を備えた6度の産業マニピュレーターで広範なシミュレーションと実験を実行することにより検証されます。
シミュレーション結果を最先端のコントローラーと比較することと、実験結果を提供することは、提案された方法がすべての約束を確立し、優れた実行を実施したことを示しています。

要約(オリジナル)

Vast industrial investment along with increased academic research on heavy-duty hydraulic manipulators has unavoidably paved the way for their automatization, necessitating the design of robust and high-precision controllers. In this study, an orchestrated robust controller is designed to address the mentioned issue for generic manipulators with an anthropomorphic arm and spherical wrist. Thanks to virtual decomposition control (VDC), the entire robotic system is decomposed into subsystems, and a robust controller is designed at each local subsystem by considering unknown model uncertainties, unknown disturbances, and compound input nonlinearities. As such, radial basic function neural networks (RBFNNs) are incorporated into VDC to tackle unknown disturbances and uncertainties, resulting in novel decentralized RBFNNs. All robust local controllers designed at each local subsystem, then, are orchestrated to accomplish high-precision control. In the end, for the first time in the context of VDC, a semi-globally uniformly ultimate boundedness is achieved under the designed controller. The validity of the theoretical results is verified by performing extensive simulations and experiments on a 6-degrees-of-freedom industrial manipulator with a nominal lifting capacity of 600 kg at 5 meters reach. Comparing the simulation result to the state-of-the-art controller along with provided experimental results, demonstrates that proposed method established all promises and performed excellently.

arxiv情報

著者 Mahdi Hejrati,Jouni Mattila
発行日 2025-02-25 07:36:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Orchestrated Robust Controller for Precision Control of Heavy-duty Hydraulic Manipulators はコメントを受け付けていません

InVDriver: Intra-Instance Aware Vectorized Query-Based Autonomous Driving Transformer

要約

全体的な最適化能力を備えたエンドツーエンドの自律運転により、学界と産業の牽引力が高まりました。
計算オーバーヘッドを削減しながらインスタンスレベルのトポロジ情報を保存するベクトル化された表現は、有望なパラダイムとして浮上しています。
既存のベクトル化されたクエリベースのフレームワークは、多くの場合、インスタンス内ポイント間の固有の空間相関を見落としており、幾何学的に一貫性のない出力(断片化されたHDマップ要素または振動軌道など)をもたらします。
これらの制限に対処するために、マスクされた自己関節層を介してインスタンス内の空間依存性を体系的にモデル化する新しいベクトル化クエリベースのシステムであるInvdriverを提案し、それにより計画の精度と軌跡の滑らかさを高めます。
すべてのコアモジュール、つまり、知覚、予測、および計画にわたって、Invdriverは、インスタンス内ポイント相互作用に注意を制限するマスクされた自己触媒メカニズムを組み込み、無関係な挿入間ノイズを抑制しながら構造要素の調整された改良性を可能にします。
ヌスセンベンチマークの実験結果は、Invdriverが最先端のパフォーマンスを達成し、高い計算効率を維持しながら、精度と安全の両方で以前の方法を上回ることを示しています。
私たちの仕事は、吸気内の幾何学的コヒーレンスの明示的なモデリングが、ベクトル化された自律運転システムを進め、エンドツーエンドのフレームワークの理論的利点と実用的な展開要件の間のギャップを埋めるために重要であることを検証します。

要約(オリジナル)

End-to-end autonomous driving with its holistic optimization capabilities, has gained increasing traction in academia and industry. Vectorized representations, which preserve instance-level topological information while reducing computational overhead, have emerged as a promising paradigm. While existing vectorized query-based frameworks often overlook the inherent spatial correlations among intra-instance points, resulting in geometrically inconsistent outputs (e.g., fragmented HD map elements or oscillatory trajectories). To address these limitations, we propose InVDriver, a novel vectorized query-based system that systematically models intra-instance spatial dependencies through masked self-attention layers, thereby enhancing planning accuracy and trajectory smoothness. Across all core modules, i.e., perception, prediction, and planning, InVDriver incorporates masked self-attention mechanisms that restrict attention to intra-instance point interactions, enabling coordinated refinement of structural elements while suppressing irrelevant inter-instance noise. Experimental results on the nuScenes benchmark demonstrate that InVDriver achieves state-of-the-art performance, surpassing prior methods in both accuracy and safety, while maintaining high computational efficiency. Our work validates that explicit modeling of intra-instance geometric coherence is critical for advancing vectorized autonomous driving systems, bridging the gap between theoretical advantages of end-to-end frameworks and practical deployment requirements.

arxiv情報

著者 Bo Zhang,Heye Huang,Chunyang Liu,Yaqin Zhang,Zhenhua Xu
発行日 2025-02-25 08:20:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | InVDriver: Intra-Instance Aware Vectorized Query-Based Autonomous Driving Transformer はコメントを受け付けていません

Quadrotor Neural Dead Reckoning in Periodic Trajectories

要約

現実世界のシナリオでは、環境またはハードウェアの制約により、象限は屋内または屋外で動作している間、純粋な慣性ナビゲーションモードでナビゲートすることを余儀なくされています。
慣性ドリフトを緩和するために、四肢装置の周期的軌跡と組み合わせたエンドツーエンドのニューラルネットワークアプローチが提案されました。
そこでは、四極距離が回帰され、慣性モデルベースの見出し推定と組み合わされて、四極位置ベクトルが推定されます。
ポジショニングパフォーマンスをさらに強化するために、このペーパーでは、周期的な軌跡を飛んでいる四肢装置の四肢神経デッドレコーンアプローチを提案します。
この場合、慣性測定値は、四角体位置ベクトルを直接推定するために、シンプルで効率的なネットワークに供給されます。
私たちのアプローチは、1つは屋内で動作し、もう1つは屋外で動作する2つの異なる四つで評価されました。
私たちのアプローチは、他の深部学習アプローチの位置決めの精度を改善し、屋外でのエラーが平均27%減少し、屋内で平均79%の削減を達成し、ソフトウェアの変更のみを必要とします。
私たちの方法によって達成されるポジショニングの精度が改善されると、四肢装置はタスクをシームレスに実行できます。

要約(オリジナル)

In real world scenarios, due to environmental or hardware constraints, the quadrotor is forced to navigate in pure inertial navigation mode while operating indoors or outdoors. To mitigate inertial drift, end-to-end neural network approaches combined with quadrotor periodic trajectories were suggested. There, the quadrotor distance is regressed and combined with inertial model-based heading estimation, the quadrotor position vector is estimated. To further enhance positioning performance, in this paper we propose a quadrotor neural dead reckoning approach for quadrotors flying on periodic trajectories. In this case, the inertial readings are fed into a simple and efficient network to directly estimate the quadrotor position vector. Our approach was evaluated on two different quadrotors, one operating indoors while the other outdoors. Our approach improves the positioning accuracy of other deep-learning approaches, achieving an average 27% reduction in error outdoors and an average 79% reduction indoors, while requiring only software modifications. With the improved positioning accuracy achieved by our method, the quadrotor can seamlessly perform its tasks.

arxiv情報

著者 Shira Massas,Itzik Klein
発行日 2025-02-25 08:39:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | Quadrotor Neural Dead Reckoning in Periodic Trajectories はコメントを受け付けていません

Multimodal Interaction and Intention Communication for Industrial Robots

要約

産業用ロボットの採用の成功は、不必要な気晴らしを避けながら、人間の環境で安全かつ効率的に動作し、自然コミュニケーションに従事し、ユーザーを理解し、直感的に意図を表明する能力に強く依存します。
この高度なレベルのヒューマンロボット相互作用(HRI)を達成するには、ロボットはユーザーのタスクと環境に関する知識を習得して組み込み、音声、動き、視線、およびその他のモダリティを組み合わせた表現力のある手がかりとマルチモーダルコミュニケーションアプローチを採用する必要があります。
このペーパーでは、非ヒト産業ロボットの表現力豊かなHRIシステムを設計、強化、評価する方法をいくつか紹介します。
フォークリフトなどの非ヒト宿主のプロキシとしてコミュニケーションをとる小さな擬人化ロボットの概念を提示します。
このロボットのマルチモーダルおよびLLM強化されたコミュニケーションフレームワークを開発し、視線追跡とモーションキャプチャを使用して、ユーザーがロボットを認識し、タスクの進行を測定する方法を定量化して、いくつかのラボ実験で評価しました。

要約(オリジナル)

Successful adoption of industrial robots will strongly depend on their ability to safely and efficiently operate in human environments, engage in natural communication, understand their users, and express intentions intuitively while avoiding unnecessary distractions. To achieve this advanced level of Human-Robot Interaction (HRI), robots need to acquire and incorporate knowledge of their users’ tasks and environment and adopt multimodal communication approaches with expressive cues that combine speech, movement, gazes, and other modalities. This paper presents several methods to design, enhance, and evaluate expressive HRI systems for non-humanoid industrial robots. We present the concept of a small anthropomorphic robot communicating as a proxy for its non-humanoid host, such as a forklift. We developed a multimodal and LLM-enhanced communication framework for this robot and evaluated it in several lab experiments, using gaze tracking and motion capture to quantify how users perceive the robot and measure the task progress.

arxiv情報

著者 Tim Schreiter,Andrey Rudenko,Jens V. Rüppel,Martin Magnusson,Achim J. Lilienthal
発行日 2025-02-25 08:44:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Multimodal Interaction and Intention Communication for Industrial Robots はコメントを受け付けていません

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

要約

大規模な言語モデル(LLMS)の統合により、具体化されたエージェントはシーン情報を処理し、自然言語の複雑な指示を計画し、具体化されたロボットの潜在的な展開への道を開く強力な機能を備えています。
しかし、予見可能な問題は、これらの具体化されたエージェントがいくつかの危険なタスクを完璧に実行し、現実世界で損害を引き起こす可能性があることです。
この問題を研究するために、具体化されたLLMエージェントの安全性を認識するタスク計画のための新しいベンチマークであるSafeAgentBenchを提示します。
SafeAgentBenchには、次のものが含まれます。(1)750のタスクを備えた新しいデータセット、10の潜在的な危険と3つのタスクタイプをカバーします。
(2)SafeAntenVは、低レベルのコントローラーを備えた普遍的な具体化された環境であり、8つの最先端のベースラインに対して17の高レベルアクションでマルチエージェント実行をサポートします。
(3)実行とセマンティックの両方の視点からの信頼できる評価方法。
実験結果は、異なる設計フレームワークに基づくエージェントがタスクの成功率に大きな違いを示すが、全体的な安全性の認識は弱いままであることを示しています。
最も安全に配慮したベースラインは、詳細な危険タスクに対して10 \%の拒否率のみを達成します。
さらに、エージェントを駆動するLLMを単純に交換しても、安全性の認識の顕著な改善につながることはありません。
詳細とコードは、https://github.com/shengyin1224/safeagentbenchで入手できます。

要約(オリジナル)

With the integration of large language models (LLMs), embodied agents have strong capabilities to process the scene information and plan complicated instructions in natural language, paving the way for the potential deployment of embodied robots. However, a foreseeable issue is that those embodied agents can also flawlessly execute some hazardous tasks, potentially causing damages in the real world. To study this issue, we present SafeAgentBench-a new benchmark for safety-aware task planning of embodied LLM agents. SafeAgentBench includes: (1) a new dataset with 750 tasks, covering 10 potential hazards and 3 task types; (2) SafeAgentEnv, a universal embodied environment with a low-level controller, supporting multi-agent execution with 17 high-level actions for 8 state-of-the-art baselines; and (3) reliable evaluation methods from both execution and semantic perspectives. Experimental results show that, although agents based on different design frameworks exhibit substantial differences in task success rates, their overall safety awareness remains weak. The most safety-conscious baseline achieves only a 10\% rejection rate for detailed hazardous tasks. Moreover, simply replacing the LLM driving the agent does not lead to notable improvements in safety awareness. More details and code are available at https://github.com/shengyin1224/SafeAgentBench.

arxiv情報

著者 Sheng Yin,Xianghe Pang,Yuanzhuo Ding,Menglan Chen,Yutong Bi,Yichen Xiong,Wenhao Huang,Zhen Xiang,Jing Shao,Siheng Chen
発行日 2025-02-25 09:20:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.RO | SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents はコメントを受け付けていません

From planning to policy: distilling $\texttt{Skill-RRT}$ for long-horizon prehensile and non-prehensile manipulation

要約

現在のロボットは、プレヘンサイル前および非摂取のスキルの長いシーケンスを必要とする操作タスクの課題に直面しています。
これには、連絡先が豊富な相互作用を処理し、それらの長期的な結果を考慮しながら複数のスキルを接続することが含まれます。
このホワイトペーパーでは、長老の問題を解決することができるが、大規模な計算時間を必要とする計画アルゴリズムを蒸留するために模倣学習を活用するフレームワークを提示します。
スキルの適用性チェックと効率的な長距離計画のためのサンプリングの中間オブジェクトポーズサンプリングを組み込んだ急速に探索するランダムツリー(RRT)の拡張である$ \ texttt {skill-rrt} $を導入します。
スキルチェーンを有効にするために、オブジェクトの妨害を最小限に抑えながらスキル間の遷移を示す$ \ textit {Connectors} $、目標調整されたポリシーを提案します。
怠zyな計画を使用すると、コネクタは関連する移行で選択的にトレーニングされ、トレーニングのコストが削減されます。
高品質のデモンストレーションは、$ \ texttt {Skill-RRT} $で生成され、ノイズベースのリプレイメカニズムによって洗練され、堅牢なポリシーパフォーマンスが確保されます。
完全にシミュレーションで訓練された蒸留ポリシーは、現実世界へのゼロショット転送、3つの挑戦的な操作タスクで80%以上の成功率を達成しています。
シミュレーションでは、私たちのアプローチは、最先端のスキルベースの強化学習方法、$ \ texttt {maple} $、および$ \ texttt {skill-rrt} $よりも優れています。

要約(オリジナル)

Current robots face challenges in manipulation tasks that require a long sequence of prehensile and non-prehensile skills. This involves handling contact-rich interactions and chaining multiple skills while considering their long-term consequences. This paper presents a framework that leverages imitation learning to distill a planning algorithm, capable of solving long-horizon problems but requiring extensive computation time, into a policy for efficient action inference. We introduce $\texttt{Skill-RRT}$, an extension of the rapidly-exploring random tree (RRT) that incorporates skill applicability checks and intermediate object pose sampling for efficient long-horizon planning. To enable skill chaining, we propose $\textit{connectors}$, goal-conditioned policies that transition between skills while minimizing object disturbance. Using lazy planning, connectors are selectively trained on relevant transitions, reducing the cost of training. High-quality demonstrations are generated with $\texttt{Skill-RRT}$ and refined by a noise-based replay mechanism to ensure robust policy performance. The distilled policy, trained entirely in simulation, zero-shot transfer to the real world, and achieves over 80% success rates across three challenging manipulation tasks. In simulation, our approach outperforms the state-of-the-art skill-based reinforcement learning method, $\texttt{MAPLE}$, and $\texttt{Skill-RRT}$.

arxiv情報

著者 Haewon Jung,Donguk Lee,Haecheol Park,JunHyeop Kim,Beomjoon Kim
発行日 2025-02-25 09:23:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | From planning to policy: distilling $\texttt{Skill-RRT}$ for long-horizon prehensile and non-prehensile manipulation はコメントを受け付けていません

DualLQR: Efficient Grasping of Oscillating Apples using Task Parameterized Learning from Demonstration

要約

デモから学ぶことで、ロボットが農業タスク、特に選択的な収穫を実行することを学ぶことができる大きな可能性を提供します。
課題の1つは、ターゲットフルーツが近づいている間に振動する可能性があることです。
握るターゲットを把握するには、2つの要件があります。1)損傷のない把握の最終的なアプローチ中のターゲットの緊密な追跡、および2)完全なパスは、効率を改善するために可能な限り短くする必要があります。
Duallqrと呼ばれる新しい方法を提案します。
この方法では、LQRを再補充する必要なく、移動ターゲットに有限Horizo​​n線形二次レギュレーター(LQR)を使用します。
これを可能にするために、2つの個別の参照フレームでLQRが実行されているデュアルLQRセットアップを使用します。
大規模なシミュレーションテストを通じて、最先端の方法は、振動せずに必要な最終精度をかろうじて満たし、振動ターゲットで必要な精度を下回ることがわかった。
一方、Duallqrは、最小の距離を移動している間、高い振動でも必要な最終精度を満たすことができることがわかりました。
現実世界のアップルを把握するタスクのさらなるテストにより、DuallQRは99%の成功率で振動するリンゴを把握することができたことが示されました。

要約(オリジナル)

Learning from Demonstration offers great potential for robots to learn to perform agricultural tasks, specifically selective harvesting. One of the challenges is that the target fruit can be oscillating while approaching. Grasping oscillating targets has two requirements: 1) close tracking of the target during the final approach for damage-free grasping, and 2) the complete path should be as short as possible for improved efficiency. We propose a new method called DualLQR. In this method, we use a finite horizon Linear Quadratic Regulator (LQR) on a moving target, without the need of refitting the LQR. To make this possible, we use a dual LQR set-up, with an LQR running in two separate reference frames. Through extensive simulation testing, it was found that the state-of-art method barely meets the required final accuracy without oscillations and drops below the required accuracy with an oscillating target. DualLQR, on the other hand, was found to be able to meet the required final accuracy even with high oscillations, while travelling the least distance. Further testing on a real-world apple grasping task showed that DualLQR was able to successfully grasp oscillating apples, with a success rate of 99%.

arxiv情報

著者 Robert van de Ven,Ard Nieuwenhuizen,Eldert J. van Henten,Gert Kootstra
発行日 2025-02-25 09:42:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DualLQR: Efficient Grasping of Oscillating Apples using Task Parameterized Learning from Demonstration はコメントを受け付けていません