Orchestrated Robust Controller for Precision Control of Heavy-duty Hydraulic Manipulators

要約

大規模な産業投資と、頑丈な油圧マニピュレーターに関する学術研究の増加は、自動化への道を避けられないほど舗装し、堅牢で高精度コントローラーの設計を必要とします。
この研究では、組織化された堅牢なコントローラーが、擬人化された腕と球形の手首を持つ一般的なマニピュレーターの上記の問題に対処するように設計されています。
仮想分解制御(VDC)のおかげで、ロボットシステム全体がサブシステムに分解され、不明なモデルの不確実性、未知の妨害、および複合入力の非線形性を考慮することにより、各ローカルサブシステムで堅牢なコントローラーが設計されています。
そのため、放射状の基本関数ニューラルネットワーク(RBFNNS)がVDCに組み込まれて、未知の妨害と不確実性に取り組み、新しい分散型RBFNNSをもたらします。
各ローカルサブシステムで設計されたすべての堅牢なローカルコントローラーは、高精度制御を達成するために調整されます。
最終的に、VDCのコンテキストで初めて、設計されたコントローラーの下で半glob的に均一に究極の境界が達成されます。
理論的結果の妥当性は、5メートルのリーチで600 kgの公称リフティング容量を備えた6度の産業マニピュレーターで広範なシミュレーションと実験を実行することにより検証されます。
シミュレーション結果を最先端のコントローラーと比較することと、実験結果を提供することは、提案された方法がすべての約束を確立し、優れた実行を実施したことを示しています。

要約(オリジナル)

Vast industrial investment along with increased academic research on heavy-duty hydraulic manipulators has unavoidably paved the way for their automatization, necessitating the design of robust and high-precision controllers. In this study, an orchestrated robust controller is designed to address the mentioned issue for generic manipulators with an anthropomorphic arm and spherical wrist. Thanks to virtual decomposition control (VDC), the entire robotic system is decomposed into subsystems, and a robust controller is designed at each local subsystem by considering unknown model uncertainties, unknown disturbances, and compound input nonlinearities. As such, radial basic function neural networks (RBFNNs) are incorporated into VDC to tackle unknown disturbances and uncertainties, resulting in novel decentralized RBFNNs. All robust local controllers designed at each local subsystem, then, are orchestrated to accomplish high-precision control. In the end, for the first time in the context of VDC, a semi-globally uniformly ultimate boundedness is achieved under the designed controller. The validity of the theoretical results is verified by performing extensive simulations and experiments on a 6-degrees-of-freedom industrial manipulator with a nominal lifting capacity of 600 kg at 5 meters reach. Comparing the simulation result to the state-of-the-art controller along with provided experimental results, demonstrates that proposed method established all promises and performed excellently.

arxiv情報

著者 Mahdi Hejrati,Jouni Mattila
発行日 2025-02-25 07:36:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Orchestrated Robust Controller for Precision Control of Heavy-duty Hydraulic Manipulators はコメントを受け付けていません

InVDriver: Intra-Instance Aware Vectorized Query-Based Autonomous Driving Transformer

要約

全体的な最適化能力を備えたエンドツーエンドの自律運転により、学界と産業の牽引力が高まりました。
計算オーバーヘッドを削減しながらインスタンスレベルのトポロジ情報を保存するベクトル化された表現は、有望なパラダイムとして浮上しています。
既存のベクトル化されたクエリベースのフレームワークは、多くの場合、インスタンス内ポイント間の固有の空間相関を見落としており、幾何学的に一貫性のない出力(断片化されたHDマップ要素または振動軌道など)をもたらします。
これらの制限に対処するために、マスクされた自己関節層を介してインスタンス内の空間依存性を体系的にモデル化する新しいベクトル化クエリベースのシステムであるInvdriverを提案し、それにより計画の精度と軌跡の滑らかさを高めます。
すべてのコアモジュール、つまり、知覚、予測、および計画にわたって、Invdriverは、インスタンス内ポイント相互作用に注意を制限するマスクされた自己触媒メカニズムを組み込み、無関係な挿入間ノイズを抑制しながら構造要素の調整された改良性を可能にします。
ヌスセンベンチマークの実験結果は、Invdriverが最先端のパフォーマンスを達成し、高い計算効率を維持しながら、精度と安全の両方で以前の方法を上回ることを示しています。
私たちの仕事は、吸気内の幾何学的コヒーレンスの明示的なモデリングが、ベクトル化された自律運転システムを進め、エンドツーエンドのフレームワークの理論的利点と実用的な展開要件の間のギャップを埋めるために重要であることを検証します。

要約(オリジナル)

End-to-end autonomous driving with its holistic optimization capabilities, has gained increasing traction in academia and industry. Vectorized representations, which preserve instance-level topological information while reducing computational overhead, have emerged as a promising paradigm. While existing vectorized query-based frameworks often overlook the inherent spatial correlations among intra-instance points, resulting in geometrically inconsistent outputs (e.g., fragmented HD map elements or oscillatory trajectories). To address these limitations, we propose InVDriver, a novel vectorized query-based system that systematically models intra-instance spatial dependencies through masked self-attention layers, thereby enhancing planning accuracy and trajectory smoothness. Across all core modules, i.e., perception, prediction, and planning, InVDriver incorporates masked self-attention mechanisms that restrict attention to intra-instance point interactions, enabling coordinated refinement of structural elements while suppressing irrelevant inter-instance noise. Experimental results on the nuScenes benchmark demonstrate that InVDriver achieves state-of-the-art performance, surpassing prior methods in both accuracy and safety, while maintaining high computational efficiency. Our work validates that explicit modeling of intra-instance geometric coherence is critical for advancing vectorized autonomous driving systems, bridging the gap between theoretical advantages of end-to-end frameworks and practical deployment requirements.

arxiv情報

著者 Bo Zhang,Heye Huang,Chunyang Liu,Yaqin Zhang,Zhenhua Xu
発行日 2025-02-25 08:20:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | InVDriver: Intra-Instance Aware Vectorized Query-Based Autonomous Driving Transformer はコメントを受け付けていません

Quadrotor Neural Dead Reckoning in Periodic Trajectories

要約

現実世界のシナリオでは、環境またはハードウェアの制約により、象限は屋内または屋外で動作している間、純粋な慣性ナビゲーションモードでナビゲートすることを余儀なくされています。
慣性ドリフトを緩和するために、四肢装置の周期的軌跡と組み合わせたエンドツーエンドのニューラルネットワークアプローチが提案されました。
そこでは、四極距離が回帰され、慣性モデルベースの見出し推定と組み合わされて、四極位置ベクトルが推定されます。
ポジショニングパフォーマンスをさらに強化するために、このペーパーでは、周期的な軌跡を飛んでいる四肢装置の四肢神経デッドレコーンアプローチを提案します。
この場合、慣性測定値は、四角体位置ベクトルを直接推定するために、シンプルで効率的なネットワークに供給されます。
私たちのアプローチは、1つは屋内で動作し、もう1つは屋外で動作する2つの異なる四つで評価されました。
私たちのアプローチは、他の深部学習アプローチの位置決めの精度を改善し、屋外でのエラーが平均27%減少し、屋内で平均79%の削減を達成し、ソフトウェアの変更のみを必要とします。
私たちの方法によって達成されるポジショニングの精度が改善されると、四肢装置はタスクをシームレスに実行できます。

要約(オリジナル)

In real world scenarios, due to environmental or hardware constraints, the quadrotor is forced to navigate in pure inertial navigation mode while operating indoors or outdoors. To mitigate inertial drift, end-to-end neural network approaches combined with quadrotor periodic trajectories were suggested. There, the quadrotor distance is regressed and combined with inertial model-based heading estimation, the quadrotor position vector is estimated. To further enhance positioning performance, in this paper we propose a quadrotor neural dead reckoning approach for quadrotors flying on periodic trajectories. In this case, the inertial readings are fed into a simple and efficient network to directly estimate the quadrotor position vector. Our approach was evaluated on two different quadrotors, one operating indoors while the other outdoors. Our approach improves the positioning accuracy of other deep-learning approaches, achieving an average 27% reduction in error outdoors and an average 79% reduction indoors, while requiring only software modifications. With the improved positioning accuracy achieved by our method, the quadrotor can seamlessly perform its tasks.

arxiv情報

著者 Shira Massas,Itzik Klein
発行日 2025-02-25 08:39:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | Quadrotor Neural Dead Reckoning in Periodic Trajectories はコメントを受け付けていません

Multimodal Interaction and Intention Communication for Industrial Robots

要約

産業用ロボットの採用の成功は、不必要な気晴らしを避けながら、人間の環境で安全かつ効率的に動作し、自然コミュニケーションに従事し、ユーザーを理解し、直感的に意図を表明する能力に強く依存します。
この高度なレベルのヒューマンロボット相互作用(HRI)を達成するには、ロボットはユーザーのタスクと環境に関する知識を習得して組み込み、音声、動き、視線、およびその他のモダリティを組み合わせた表現力のある手がかりとマルチモーダルコミュニケーションアプローチを採用する必要があります。
このペーパーでは、非ヒト産業ロボットの表現力豊かなHRIシステムを設計、強化、評価する方法をいくつか紹介します。
フォークリフトなどの非ヒト宿主のプロキシとしてコミュニケーションをとる小さな擬人化ロボットの概念を提示します。
このロボットのマルチモーダルおよびLLM強化されたコミュニケーションフレームワークを開発し、視線追跡とモーションキャプチャを使用して、ユーザーがロボットを認識し、タスクの進行を測定する方法を定量化して、いくつかのラボ実験で評価しました。

要約(オリジナル)

Successful adoption of industrial robots will strongly depend on their ability to safely and efficiently operate in human environments, engage in natural communication, understand their users, and express intentions intuitively while avoiding unnecessary distractions. To achieve this advanced level of Human-Robot Interaction (HRI), robots need to acquire and incorporate knowledge of their users’ tasks and environment and adopt multimodal communication approaches with expressive cues that combine speech, movement, gazes, and other modalities. This paper presents several methods to design, enhance, and evaluate expressive HRI systems for non-humanoid industrial robots. We present the concept of a small anthropomorphic robot communicating as a proxy for its non-humanoid host, such as a forklift. We developed a multimodal and LLM-enhanced communication framework for this robot and evaluated it in several lab experiments, using gaze tracking and motion capture to quantify how users perceive the robot and measure the task progress.

arxiv情報

著者 Tim Schreiter,Andrey Rudenko,Jens V. Rüppel,Martin Magnusson,Achim J. Lilienthal
発行日 2025-02-25 08:44:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Multimodal Interaction and Intention Communication for Industrial Robots はコメントを受け付けていません

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

要約

大規模な言語モデル(LLMS)の統合により、具体化されたエージェントはシーン情報を処理し、自然言語の複雑な指示を計画し、具体化されたロボットの潜在的な展開への道を開く強力な機能を備えています。
しかし、予見可能な問題は、これらの具体化されたエージェントがいくつかの危険なタスクを完璧に実行し、現実世界で損害を引き起こす可能性があることです。
この問題を研究するために、具体化されたLLMエージェントの安全性を認識するタスク計画のための新しいベンチマークであるSafeAgentBenchを提示します。
SafeAgentBenchには、次のものが含まれます。(1)750のタスクを備えた新しいデータセット、10の潜在的な危険と3つのタスクタイプをカバーします。
(2)SafeAntenVは、低レベルのコントローラーを備えた普遍的な具体化された環境であり、8つの最先端のベースラインに対して17の高レベルアクションでマルチエージェント実行をサポートします。
(3)実行とセマンティックの両方の視点からの信頼できる評価方法。
実験結果は、異なる設計フレームワークに基づくエージェントがタスクの成功率に大きな違いを示すが、全体的な安全性の認識は弱いままであることを示しています。
最も安全に配慮したベースラインは、詳細な危険タスクに対して10 \%の拒否率のみを達成します。
さらに、エージェントを駆動するLLMを単純に交換しても、安全性の認識の顕著な改善につながることはありません。
詳細とコードは、https://github.com/shengyin1224/safeagentbenchで入手できます。

要約(オリジナル)

With the integration of large language models (LLMs), embodied agents have strong capabilities to process the scene information and plan complicated instructions in natural language, paving the way for the potential deployment of embodied robots. However, a foreseeable issue is that those embodied agents can also flawlessly execute some hazardous tasks, potentially causing damages in the real world. To study this issue, we present SafeAgentBench-a new benchmark for safety-aware task planning of embodied LLM agents. SafeAgentBench includes: (1) a new dataset with 750 tasks, covering 10 potential hazards and 3 task types; (2) SafeAgentEnv, a universal embodied environment with a low-level controller, supporting multi-agent execution with 17 high-level actions for 8 state-of-the-art baselines; and (3) reliable evaluation methods from both execution and semantic perspectives. Experimental results show that, although agents based on different design frameworks exhibit substantial differences in task success rates, their overall safety awareness remains weak. The most safety-conscious baseline achieves only a 10\% rejection rate for detailed hazardous tasks. Moreover, simply replacing the LLM driving the agent does not lead to notable improvements in safety awareness. More details and code are available at https://github.com/shengyin1224/SafeAgentBench.

arxiv情報

著者 Sheng Yin,Xianghe Pang,Yuanzhuo Ding,Menglan Chen,Yutong Bi,Yichen Xiong,Wenhao Huang,Zhen Xiang,Jing Shao,Siheng Chen
発行日 2025-02-25 09:20:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.RO | SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents はコメントを受け付けていません

From planning to policy: distilling $\texttt{Skill-RRT}$ for long-horizon prehensile and non-prehensile manipulation

要約

現在のロボットは、プレヘンサイル前および非摂取のスキルの長いシーケンスを必要とする操作タスクの課題に直面しています。
これには、連絡先が豊富な相互作用を処理し、それらの長期的な結果を考慮しながら複数のスキルを接続することが含まれます。
このホワイトペーパーでは、長老の問題を解決することができるが、大規模な計算時間を必要とする計画アルゴリズムを蒸留するために模倣学習を活用するフレームワークを提示します。
スキルの適用性チェックと効率的な長距離計画のためのサンプリングの中間オブジェクトポーズサンプリングを組み込んだ急速に探索するランダムツリー(RRT)の拡張である$ \ texttt {skill-rrt} $を導入します。
スキルチェーンを有効にするために、オブジェクトの妨害を最小限に抑えながらスキル間の遷移を示す$ \ textit {Connectors} $、目標調整されたポリシーを提案します。
怠zyな計画を使用すると、コネクタは関連する移行で選択的にトレーニングされ、トレーニングのコストが削減されます。
高品質のデモンストレーションは、$ \ texttt {Skill-RRT} $で生成され、ノイズベースのリプレイメカニズムによって洗練され、堅牢なポリシーパフォーマンスが確保されます。
完全にシミュレーションで訓練された蒸留ポリシーは、現実世界へのゼロショット転送、3つの挑戦的な操作タスクで80%以上の成功率を達成しています。
シミュレーションでは、私たちのアプローチは、最先端のスキルベースの強化学習方法、$ \ texttt {maple} $、および$ \ texttt {skill-rrt} $よりも優れています。

要約(オリジナル)

Current robots face challenges in manipulation tasks that require a long sequence of prehensile and non-prehensile skills. This involves handling contact-rich interactions and chaining multiple skills while considering their long-term consequences. This paper presents a framework that leverages imitation learning to distill a planning algorithm, capable of solving long-horizon problems but requiring extensive computation time, into a policy for efficient action inference. We introduce $\texttt{Skill-RRT}$, an extension of the rapidly-exploring random tree (RRT) that incorporates skill applicability checks and intermediate object pose sampling for efficient long-horizon planning. To enable skill chaining, we propose $\textit{connectors}$, goal-conditioned policies that transition between skills while minimizing object disturbance. Using lazy planning, connectors are selectively trained on relevant transitions, reducing the cost of training. High-quality demonstrations are generated with $\texttt{Skill-RRT}$ and refined by a noise-based replay mechanism to ensure robust policy performance. The distilled policy, trained entirely in simulation, zero-shot transfer to the real world, and achieves over 80% success rates across three challenging manipulation tasks. In simulation, our approach outperforms the state-of-the-art skill-based reinforcement learning method, $\texttt{MAPLE}$, and $\texttt{Skill-RRT}$.

arxiv情報

著者 Haewon Jung,Donguk Lee,Haecheol Park,JunHyeop Kim,Beomjoon Kim
発行日 2025-02-25 09:23:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | From planning to policy: distilling $\texttt{Skill-RRT}$ for long-horizon prehensile and non-prehensile manipulation はコメントを受け付けていません

DualLQR: Efficient Grasping of Oscillating Apples using Task Parameterized Learning from Demonstration

要約

デモから学ぶことで、ロボットが農業タスク、特に選択的な収穫を実行することを学ぶことができる大きな可能性を提供します。
課題の1つは、ターゲットフルーツが近づいている間に振動する可能性があることです。
握るターゲットを把握するには、2つの要件があります。1)損傷のない把握の最終的なアプローチ中のターゲットの緊密な追跡、および2)完全なパスは、効率を改善するために可能な限り短くする必要があります。
Duallqrと呼ばれる新しい方法を提案します。
この方法では、LQRを再補充する必要なく、移動ターゲットに有限Horizo​​n線形二次レギュレーター(LQR)を使用します。
これを可能にするために、2つの個別の参照フレームでLQRが実行されているデュアルLQRセットアップを使用します。
大規模なシミュレーションテストを通じて、最先端の方法は、振動せずに必要な最終精度をかろうじて満たし、振動ターゲットで必要な精度を下回ることがわかった。
一方、Duallqrは、最小の距離を移動している間、高い振動でも必要な最終精度を満たすことができることがわかりました。
現実世界のアップルを把握するタスクのさらなるテストにより、DuallQRは99%の成功率で振動するリンゴを把握することができたことが示されました。

要約(オリジナル)

Learning from Demonstration offers great potential for robots to learn to perform agricultural tasks, specifically selective harvesting. One of the challenges is that the target fruit can be oscillating while approaching. Grasping oscillating targets has two requirements: 1) close tracking of the target during the final approach for damage-free grasping, and 2) the complete path should be as short as possible for improved efficiency. We propose a new method called DualLQR. In this method, we use a finite horizon Linear Quadratic Regulator (LQR) on a moving target, without the need of refitting the LQR. To make this possible, we use a dual LQR set-up, with an LQR running in two separate reference frames. Through extensive simulation testing, it was found that the state-of-art method barely meets the required final accuracy without oscillations and drops below the required accuracy with an oscillating target. DualLQR, on the other hand, was found to be able to meet the required final accuracy even with high oscillations, while travelling the least distance. Further testing on a real-world apple grasping task showed that DualLQR was able to successfully grasp oscillating apples, with a success rate of 99%.

arxiv情報

著者 Robert van de Ven,Ard Nieuwenhuizen,Eldert J. van Henten,Gert Kootstra
発行日 2025-02-25 09:42:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DualLQR: Efficient Grasping of Oscillating Apples using Task Parameterized Learning from Demonstration はコメントを受け付けていません

OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation

要約

Vision-Language Navigation(VLN)は、言語の指示と視覚的な手がかりの両方を活用して、具体化されたAIで極めて重要な役割を果たすことにより、エージェントを環境に導くことを目的としています。
屋内VLNは広範囲に研究されていますが、屋外の空中VLNは未掘削装置のままです。
潜在的な理由は、屋外の空中ビューには広大なエリアが含まれ、データ収集がより困難になり、ベンチマークが不足していることです。
この問題に対処するために、汎用性の高いツールチェーンと空中VLNの大規模なベンチマークを含むプラットフォームであるOpenFlyを提案します。
まず、データ収集用の高度に自動化されたツールチェーンを開発し、自動ポイントクラウドの取得、シーンセマンティックセグメンテーション、フライト軌道の作成、および命令生成を可能にします。
第二に、ツールチェーンに基づいて、100kの軌跡を備えた大規模な空中VLNデータセットを構築し、18シーンの多様な高さと長さをカバーします。
対応する視覚データは、Unreal Engine、GTA V、Google Earth、3D Gaussian Splatting(3D GS)など、さまざまなレンダリングエンジンと高度な技術を使用して生成されます。
すべてのデータは高い視覚品質を示しています。
特に、3D GSは実際のレンダリングをサポートし、データセットのリアリズムをさらに強化します。
第三に、言語命令、現在の観測、および履歴キーフレームを入力として採用し、飛行アクションを直接出力するキーフレーム認識VLNモデルであるOpenFly-Agentを提案します。
広範な分析と実験が行われ、OpenFlyプラットフォームとOpenFly-Agentの優位性を示しています。
ツールチェーン、データセット、およびコードはオープンソースをかけます。

要約(オリジナル)

Vision-Language Navigation (VLN) aims to guide agents through an environment by leveraging both language instructions and visual cues, playing a pivotal role in embodied AI. Indoor VLN has been extensively studied, whereas outdoor aerial VLN remains underexplored. The potential reason is that outdoor aerial view encompasses vast areas, making data collection more challenging, which results in a lack of benchmarks. To address this problem, we propose OpenFly, a platform comprising a versatile toolchain and large-scale benchmark for aerial VLN. Firstly, we develop a highly automated toolchain for data collection, enabling automatic point cloud acquisition, scene semantic segmentation, flight trajectory creation, and instruction generation. Secondly, based on the toolchain, we construct a large-scale aerial VLN dataset with 100k trajectories, covering diverse heights and lengths across 18 scenes. The corresponding visual data are generated using various rendering engines and advanced techniques, including Unreal Engine, GTA V, Google Earth, and 3D Gaussian Splatting (3D GS). All data exhibit high visual quality. Particularly, 3D GS supports real-to-sim rendering, further enhancing the realism of the dataset. Thirdly, we propose OpenFly-Agent, a keyframe-aware VLN model, which takes language instructions, current observations, and historical keyframes as input, and outputs flight actions directly. Extensive analyses and experiments are conducted, showcasing the superiority of our OpenFly platform and OpenFly-Agent. The toolchain, dataset, and codes will be open-sourced.

arxiv情報

著者 Yunpeng Gao,Chenhui Li,Zhongrui You,Junli Liu,Zhen Li,Pengan Chen,Qizhi Chen,Zhonghan Tang,Liansheng Wang,Penghui Yang,Yiwen Tang,Yuhang Tang,Shuai Liang,Songyi Zhu,Ziqin Xiong,Yifei Su,Xinyi Ye,Jianan Li,Yan Ding,Dong Wang,Zhigang Wang,Bin Zhao,Xuelong Li
発行日 2025-02-25 09:57:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation はコメントを受け付けていません

S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM

要約

ローカリゼーションとマッピングに基づいた作業は、ロボットポーズとそのマップ要素をより高速かつ効率的な管理と最適化のために、環境からの固有のセマンティックリレーショナル情報を活用せず、多くの場合、大規模な環境での不正確さと計算の非効率性をもたらし、マッピングします。
環境を階層的に分配する3Dシーングラフ表現を活用して、基礎となるロボットポーズとそのマップの管理/最適化を強化することができます。
この方向には、効率的なデータ管理と最適化のために屋内シーンの階層構造を活用する作業状況グラフ2.0を提示します。
私たちのアルゴリズムは、キーフレーム、壁、部屋、床の4つのレイヤーに環境を整理する状況グラフを構築することから始まります。
私たちの最初のノベルティは、階段を識別し、床レベルのセマンティック関係を基礎となる層に割り当てることができるフロア検出モジュールを含むフロントエンドにあります。
このフロアレベルのセマンティックは、フロアベースのループ閉鎖戦略を可能にし、異なる床の視覚的に類似した領域での偽陽性ループ閉鎖を拒否します。
2番目の斬新さは、最適化の改善のために階層を利用することです。
(1)ローカル最適化、最近のキーフレームとその接続されたコンポーネントのウィンドウの最適化、(2)ループクロージャー中の現在の床内のキーフレームとその接続のみに焦点を当てた床 – グローバル最適化、および(3)部屋
– ローカルの最適化、部屋内の観測を共有する冗長な冗長キーフレームを疎外する。
さまざまな実際のマルチフロア環境でアルゴリズムを広範囲に検証します。
私たちのアプローチは、いくつかのベースラインが効率的に実行できない計算の複雑さを制限しながら、階層マップを作成する大規模なマルチフロア環境で最先端の結果を示すことができます。

要約(オリジナル)

Works based on localization and mapping do not exploit the inherent semantic-relational information from the environment for faster and efficient management and optimization of the robot poses and its map elements, often leading to pose and map inaccuracies and computational inefficiencies in large scale environments. 3D scene graph representations which distributes the environment in an hierarchical manner can be exploited to enhance the management/optimization of underlying robot poses and its map. In this direction, we present our work Situational Graphs 2.0, which leverages the hierarchical structure of indoor scenes for efficient data management and optimization. Our algorithm begins by constructing a situational graph that organizes the environment into four layers: Keyframes, Walls, Rooms, and Floors. Our first novelty lies in the front-end which includes a floor detection module capable of identifying stairways and assigning a floor-level semantic-relations to the underlying layers. This floor-level semantic enables a floor-based loop closure strategy, rejecting false-positive loop closures in visually similar areas on different floors. Our second novelty is in exploiting the hierarchy for an improved optimization. It consists of: (1) local optimization, optimizing a window of recent keyframes and their connected components, (2) floor-global optimization, which focuses only on keyframes and their connections within the current floor during loop closures, and (3) room-local optimization, marginalizing redundant keyframes that share observations within the room. We validate our algorithm extensively in different real multi-floor environments. Our approach can demonstrate state-of-art-art results in large scale multi-floor environments creating hierarchical maps while bounding the computational complexity where several baseline works fail to execute efficiently.

arxiv情報

著者 Hriday Bavle,Jose Luis Sanchez-Lopez,Muhammad Shaheer,Javier Civera,Holger Voos
発行日 2025-02-25 10:09:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SE | S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM はコメントを受け付けていません

Ordered Genetic Algorithm for Entrance Dependent Vehicle Routing Problem in Farms

要約

車両ルーティングの問題(VRP)は、多くの生産シナリオで重要な役割を果たす広く研究されている問題です。
VRPの実際のシナリオでは、都市のサイズとその入り口が最適化プロセスに大きく影響する可能性があることに気付きました。
これに対処するために、そのような問題を説明するために、入り口に依存するVRP(EDVRP)を構築しました。
農場でEDVRPに数学的定式化を提供し、それを解決するために順序付けられた遺伝的アルゴリズム(OGA)を提案します。
OGAの有効性は、ランダムに生成された多数のケースを含む実験を通じて実証されています。
結果は、OGAがランダム戦略ベースラインと注文せずに遺伝的アルゴリズムと比較して特定の利点を提供することを示しています。
さらに、この論文で導入された新しいオペレーターは、アブレーション実験を通じて検証されており、アルゴリズムのパフォーマンスを向上させる有効性を証明しています。

要約(オリジナル)

Vehicle Routing Problems (VRP) are widely studied issues that play important roles in many production scenarios. We have noticed that in some practical scenarios of VRP, the size of cities and their entrances can significantly influence the optimization process. To address this, we have constructed the Entrance Dependent VRP (EDVRP) to describe such problems. We provide a mathematical formulation for the EDVRP in farms and propose an Ordered Genetic Algorithm (OGA) to solve it. The effectiveness of OGA is demonstrated through our experiments, which involve a multitude of randomly generated cases. The results indicate that OGA offers certain advantages compared to a random strategy baseline and a genetic algorithm without ordering. Furthermore, the novel operators introduced in this paper have been validated through ablation experiments, proving their effectiveness in enhancing the performance of the algorithm.

arxiv情報

著者 Haotian Xu,Xiaohui Fan,Jialin Zhu,Qing Zhuo,Tao Zhang
発行日 2025-02-25 10:30:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Ordered Genetic Algorithm for Entrance Dependent Vehicle Routing Problem in Farms はコメントを受け付けていません