Video-Based Detection and Analysis of Errors in Robotic Surgical Training

要約

ロボット支援の低侵襲手術は多くの利点を提供しますが、外科医が習得するのに何年もかかる複雑な運動タスクが必要です。
現在、外科医がこれらのロボット外科的スキルを獲得する方法に関する知識が不足しています。
このギャップを埋めるために、私たちは以前、6か月にわたって外科ロボットで複雑な外科訓練ドライラブタスクを学ぶ外科居住者に続きました。
エラーは、自己トレーニングとスキル評価の重要な尺度ですが、仮想シミュレーションとは異なり、ドライラブトレーニングでは、エラーを自動的に監視することは困難です。
ここでは、リングタワーの移動タスクのエラーを分析しました。この登場では、手術居住者が湾曲したワイヤーに沿ってリングをできるだけ早く正確に移動しました。
衝突エラーを検出するための画像処理アルゴリズムを開発し、検出精度を達成しました。
検出されたエラーとタスクの完了時間を使用して、外科的居住者が6か月間の完了時間とエラー数を短縮することがわかりました。
この分析は、同様の外科的トレーニングタスクの衝突エラーを検出するためのフレームワークを提供し、外科居住者の学習プロセスに光を当てます。

要約(オリジナル)

Robot-assisted minimally invasive surgeries offer many advantages but require complex motor tasks that take surgeons years to master. There is currently a lack of knowledge on how surgeons acquire these robotic surgical skills. To help bridge this gap, we previously followed surgical residents learning complex surgical training dry-lab tasks on a surgical robot over six months. Errors are an important measure for self-training and for skill evaluation, but unlike in virtual simulations, in dry-lab training, errors are difficult to monitor automatically. Here, we analyzed the errors in the ring tower transfer task, in which surgical residents moved a ring along a curved wire as quickly and accurately as possible. We developed an image-processing algorithm to detect collision errors and achieved detection accuracy of ~95%. Using the detected errors and task completion time, we found that the surgical residents decreased their completion time and number of errors over the six months. This analysis provides a framework for detecting collision errors in similar surgical training tasks and sheds light on the learning process of the surgical residents.

arxiv情報

著者 Hanna Kossowsky Lev,Yarden Sharon,Alex Geftler,Ilana Nisky
発行日 2025-04-28 08:29:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Video-Based Detection and Analysis of Errors in Robotic Surgical Training はコメントを受け付けていません

Category-Level and Open-Set Object Pose Estimation for Robotics

要約

オブジェクトのポーズ推定により、シーンの理解やロボットの把握など、コンピュータービジョンやロボット工学のさまざまなタスクが可能になります。
ポーズ推定タスクの複雑さは、ターゲットオブジェクトに関連する未知の変数に依存します。
インスタンスレベルのメソッドは、テクスチャ、形状、サイズが部分的または完全に未知のカテゴリレベルとオープンセットのメソッド、不透明なオブジェクトとランバートのオブジェクトにすでに優れていますが、これらの基本的な材料特性と格闘しています。
これらのシナリオではテクスチャは不明であるため、オブジェクトの対称性を編成するために使用することはできません。6Dオブジェクトのもう1つのコアチャレンジは推定されます。
このような不明なマニホールドで6Dポーズを推定する複雑さは、さまざまなデータセット、精度メトリック、およびアルゴリズムソリューションにつながりました。
このペーパーでは、カテゴリレベルで6Dポーズ推定を解くためのデータセット、精度メトリック、およびアルゴリズムを比較します。
この比較に基づいて、カテゴリレベルとオープンセットのオブジェクトのポーズ推定をブリッジする方法を分析して、一般化に到達し、実用的な推奨事項を提供します。

要約(オリジナル)

Object pose estimation enables a variety of tasks in computer vision and robotics, including scene understanding and robotic grasping. The complexity of a pose estimation task depends on the unknown variables related to the target object. While instance-level methods already excel for opaque and Lambertian objects, category-level and open-set methods, where texture, shape, and size are partially or entirely unknown, still struggle with these basic material properties. Since texture is unknown in these scenarios, it cannot be used for disambiguating object symmetries, another core challenge of 6D object pose estimation. The complexity of estimating 6D poses with such a manifold of unknowns led to various datasets, accuracy metrics, and algorithmic solutions. This paper compares datasets, accuracy metrics, and algorithms for solving 6D pose estimation on the category-level. Based on this comparison, we analyze how to bridge category-level and open-set object pose estimation to reach generalization and provide actionable recommendations.

arxiv情報

著者 Peter Hönig,Matthias Hirschmanner,Markus Vincze
発行日 2025-04-28 08:31:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Category-Level and Open-Set Object Pose Estimation for Robotics はコメントを受け付けていません

Smart Placement, Faster Robots — A Comparison of Algorithms for Robot Base-Pose Optimization

要約

ロボットオートメーションは、製造プロセスの効率と柔軟性を向上させる重要なテクノロジーです。
ただし、新しい環境でロボットを展開する際の課題の1つは、ロボットの最適なベースポーズを見つけることです。これは、その到達可能性と展開コストに影響します。
しかし、ロボットのベースポーズを自動的に最適化するための既存の研究は比較されていません。
ベイジアンの最適化、徹底的な検索、遺伝的アルゴリズム、および確率的勾配降下を備えた産業用ロボットの基本ポーズを最適化することにより、この問題に対処し、すべてのアルゴリズムが合成および現実世界の環境でのさまざまな評価されたタスクのサイクル時間を短縮できることがわかります。
確率的勾配降下は、実世界のタスクの90%以上を解く成功率に関して優れた性能を示し、遺伝的アルゴリズムは最終コストが最も低いことを示しています。
すべてのベンチマークと実装されたメソッドは、新しいアプローチを比較できるベースラインとして利用できます。

要約(オリジナル)

Robotic automation is a key technology that increases the efficiency and flexibility of manufacturing processes. However, one of the challenges in deploying robots in novel environments is finding the optimal base pose for the robot, which affects its reachability and deployment cost. Yet, the existing research for automatically optimizing the base pose of robots has not been compared. We address this problem by optimizing the base pose of industrial robots with Bayesian optimization, exhaustive search, genetic algorithms, and stochastic gradient descent and find that all algorithms can reduce the cycle time for various evaluated tasks in synthetic and real-world environments. Stochastic gradient descent shows superior performance with regard to success rate solving over 90% of our real-world tasks, while genetic algorithms show the lowest final costs. All benchmarks and implemented methods are available as baselines against which novel approaches can be compared.

arxiv情報

著者 Matthias Mayer,Matthias Althoff
発行日 2025-04-28 08:36:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Smart Placement, Faster Robots — A Comparison of Algorithms for Robot Base-Pose Optimization はコメントを受け付けていません

ARTEMIS: Autoregressive End-to-End Trajectory Planning with Mixture of Experts for Autonomous Driving

要約

このペーパーでは、自己回帰の軌跡計画と混合物(MOE)を組み合わせたエンドツーエンドの自律運転フレームワークであるArtemisを紹介します。
従来のモジュラー方法はエラーの伝播に悩まされますが、既存のエンドツーエンドモデルは通常、環境の動的な変化を不十分にキャプチャする静的なワンショット推論パラダイムを採用しています。
Artemisは、軌道のウェイポイントを順次生成することにより異なる方法を採用し、重要な時間的依存関係を保存しながら、シーン固有のクエリを専門の専門家ネットワークに動的にルーティングします。
ガイダンス情報が曖昧な場合に遭遇する軌道の品質劣化の問題を効果的に緩和し、多様な駆動シナリオを処理する際に特異ネットワークアーキテクチャの固有の表現の制限を克服します。
さらに、混合物モデルのトレーニング速度を大幅に改善する軽量バッチリアルロケーション戦略を使用します。
NAVSIMデータセットでの実験を通じて、Artemisは優れた競争力のあるパフォーマンスを示し、ResNet-34バックボーンで87.0 PDMSと83.1 EPDMSを達成し、複数のメトリックで最先端のパフォーマンスを示します。

要約(オリジナル)

This paper presents ARTEMIS, an end-to-end autonomous driving framework that combines autoregressive trajectory planning with Mixture-of-Experts (MoE). Traditional modular methods suffer from error propagation, while existing end-to-end models typically employ static one-shot inference paradigms that inadequately capture the dynamic changes of the environment. ARTEMIS takes a different method by generating trajectory waypoints sequentially, preserves critical temporal dependencies while dynamically routing scene-specific queries to specialized expert networks. It effectively relieves trajectory quality degradation issues encountered when guidance information is ambiguous, and overcomes the inherent representational limitations of singular network architectures when processing diverse driving scenarios. Additionally, we use a lightweight batch reallocation strategy that significantly improves the training speed of the Mixture-of-Experts model. Through experiments on the NAVSIM dataset, ARTEMIS exhibits superior competitive performance, achieving 87.0 PDMS and 83.1 EPDMS with ResNet-34 backbone, demonstrates state-of-the-art performance on multiple metrics.

arxiv情報

著者 Renju Feng,Ning Xi,Duanfeng Chu,Rukang Wang,Zejian Deng,Anzheng Wang,Liping Lu,Jinxiang Wang,Yanjun Huang
発行日 2025-04-28 08:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | ARTEMIS: Autoregressive End-to-End Trajectory Planning with Mixture of Experts for Autonomous Driving はコメントを受け付けていません

A Time-dependent Risk-aware distributed Multi-Agent Path Finder based on A*

要約

Multi-Agent Path-Finding(MAPF)は、衝突のないナビゲーションを目指して、共有スペース内の複数のエージェントのパスの共同計画に焦点を当てています。
従来の計画方法は、しばしば他のエージェントの存在を見落としているため、対立をもたらす可能性があります。
これに応じて、この記事では、A $^*_+$ Tアルゴリズムを紹介します。これは、エージェントの移動速度に基づいて位置を予測することでエージェント間の調整を改善する分散アプローチです。
このアルゴリズムは、観測された速度と軌跡に関する潜在的な衝突を評価し、それによって他のエージェントや移動オブジェクトが住む環境での衝突のない経路計画を促進する動的な障害を考慮します。
動的エンティティと静的エンティティの両方を取り巻くリスク層を組み込み、実際のアプリケーションでの有用性を高めます。
各エージェントは、他の人が選択したパスに留意しながら、自律的に機能し、マルチエージェントの状況に固有の複雑さに効果的に対処します。
$^*_+$ Tのパフォーマンスは、Gazeboシミュレーション環境で厳密にテストされており、CBS、ECB、SIPPなどの確立されたアプローチに対してベンチマークされています。
さらに、このアルゴリズムは単一エージェントの実験の能力を示しており、結果は動的障害を管理し、さまざまなシナリオにわたって実際的な関連性を確認する際の有効性を示しています。

要約(オリジナル)

Multi-Agent Path-Finding (MAPF) focuses on the collaborative planning of paths for multiple agents within shared spaces, aiming for collision-free navigation. Conventional planning methods often overlook the presence of other agents, which can result in conflicts. In response, this article introduces the A$^*_+$T algorithm, a distributed approach that improves coordination among agents by anticipating their positions based on their movement speeds. The algorithm also considers dynamic obstacles, assessing potential collisions with respect to observed speeds and trajectories, thereby facilitating collision-free path planning in environments populated by other agents and moving objects. It incorporates a risk layer surrounding both dynamic and static entities, enhancing its utility in real-world applications. Each agent functions autonomously while being mindful of the paths chosen by others, effectively addressing the complexities inherent in multi-agent situations. The performance of A$^*_+$T has been rigorously tested in the Gazebo simulation environment and benchmarked against established approaches such as CBS, ECBS, and SIPP. Furthermore, the algorithm has shown competence in single-agent experiments, with results demonstrating its effectiveness in managing dynamic obstacles and affirming its practical relevance across various scenarios.

arxiv情報

著者 S Nordström,Y Bai,B Lindqvist,G Nikolakopoulos
発行日 2025-04-28 08:57:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T40, cs.RO | A Time-dependent Risk-aware distributed Multi-Agent Path Finder based on A* はコメントを受け付けていません

Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties

要約

泥だらけの地形は、組成と水分の微妙な変化が基質の強度と力の反応に大きなばらつきにつながり、ロボットが滑りたり詰まったりすることがあるため、陸生ロボットに大きな課題をもたらします。
このホワイトペーパーでは、固有受容センシングを使用して泥特性を推定する方法を提示し、フリッパー駆動型のロボットがさまざまな強度の泥だらけの基板を介してその運動を適応させることができます。
まず、アクチュエータ電流と静的に取り付けられたロボットフリッパーからの位置信号を介して泥反力を特徴付けます。
測定された力を使用して、固有の泥特性を特徴付ける重要な係数を決定します。
固有受容的に推定された係数は、ラボグレードの負荷セルからの測定と密接に一致し、提案された方法の有効性を検証します。
次に、さまざまな泥の混合物をcraい回る際にオンラインで泥特性を推定するために、機関のロボットにこの方法を拡張します。
実験データは、泥反反力がロボットの動きに敏感に依存していることを明らかにしており、泥特性を正しく決定するために固有受容力とのロボットの動きの共同分析が必要です。
最後に、この方法をさまざまな強度の泥だらけの基板を横切って移動するフリッパー駆動のロボットに展開し、提案された方法により、ロボットが推定泥特性を使用して運動戦略を適応させ、移動障害を避けることができることを実証します。
私たちの調査結果は、複雑で変形可能な自然環境でのロボットの移動性を高めるための固有受容ベースの地形センシングの可能性を強調し、より堅牢なフィールド探索機能への道を開いています。

要約(オリジナル)

Muddy terrains present significant challenges for terrestrial robots, as subtle changes in composition and water content can lead to large variations in substrate strength and force responses, causing the robot to slip or get stuck. This paper presents a method to estimate mud properties using proprioceptive sensing, enabling a flipper-driven robot to adapt its locomotion through muddy substrates of varying strength. First, we characterize mud reaction forces through actuator current and position signals from a statically mounted robotic flipper. We use the measured force to determine key coefficients that characterize intrinsic mud properties. The proprioceptively estimated coefficients match closely with measurements from a lab-grade load cell, validating the effectiveness of the proposed method. Next, we extend the method to a locomoting robot to estimate mud properties online as it crawls across different mud mixtures. Experimental data reveal that mud reaction forces depend sensitively on robot motion, requiring joint analysis of robot movement with proprioceptive force to determine mud properties correctly. Lastly, we deploy this method in a flipper-driven robot moving across muddy substrates of varying strengths, and demonstrate that the proposed method allows the robot to use the estimated mud properties to adapt its locomotion strategy, and successfully avoid locomotion failures. Our findings highlight the potential of proprioception-based terrain sensing to enhance robot mobility in complex, deformable natural environments, paving the way for more robust field exploration capabilities.

arxiv情報

著者 Shipeng Liu,Jiaze Tang,Siyuan Meng,Feifei Qian
発行日 2025-04-28 09:12:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties はコメントを受け付けていません

HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit

要約

一般化可能なヒューマノイド操作は、調整された全身制御と正確な接触豊富なオブジェクト操作を必要とする重要な課題をもたらします。
これに対処するために、このペーパーでは、ペダルにマッピングされたボディコントロールの強化学習ポリシーを組み合わせた半自動化学的操作システム、腕制御のための同型外骨格アーム、および手コントロールのモーションセンスグローブを組み合わせて、統一コックピットを形成し、ヒューマロイドを動作させる統一コックピットを形成する相棒を紹介します。
このポリシーには、上半身のポーズカリキュラム、高さ追跡報酬、対称的利用など、新しいデザインが組み込まれています。
これらの機能により、システムは任意の上半身のポーズにシームレスに適応しながら、特定の高さまで歩行としゃがむことができます。
外骨格は、逆ダイナミクスへの依存を排除​​することにより、より速く、より正確な腕制御を実現します。
グローブはサーボの代わりにホールセンサーを利用しているため、コンパクトなデバイスでさえ15度以上の自由度を実現し、器用な手のあらゆるモデルに自由に適応することができます。
以前のテレオ操作システムと比較して、Homieはその並外れた効率で際立っており、半分の時間でタスクを完了しています。
拡張された作業範囲により、ユーザーは高領域と低い領域に自由に到達し、オブジェクトと対話することができます。
手頃な価格で、価格はわずか500ドルです。
システムは完全にオープンソースであり、デモとコードはhttps://homietele.github.io/にあります。

要約(オリジナル)

Generalizable humanoid loco-manipulation poses significant challenges, requiring coordinated whole-body control and precise, contact-rich object manipulation. To address this, this paper introduces HOMIE, a semi-autonomous teleoperation system that combines a reinforcement learning policy for body control mapped to a pedal, an isomorphic exoskeleton arm for arm control, and motion-sensing gloves for hand control, forming a unified cockpit to freely operate humanoids and establish a data flywheel. The policy incorporates novel designs, including an upper-body pose curriculum, a height-tracking reward, and symmetry utilization. These features enable the system to perform walking and squatting to specific heights while seamlessly adapting to arbitrary upper-body poses. The exoskeleton, by eliminating the reliance on inverse dynamics, delivers faster and more precise arm control. The gloves utilize Hall sensors instead of servos, allowing even compact devices to achieve 15 or more degrees of freedom and freely adapt to any model of dexterous hands. Compared to previous teleoperation systems, HOMIE stands out for its exceptional efficiency, completing tasks in half the time; its expanded working range, allowing users to freely reach high and low areas as well as interact with any objects; and its affordability, with a price of just $500. The system is fully open-source, demos and code can be found in our https://homietele.github.io/.

arxiv情報

著者 Qingwei Ben,Feiyu Jia,Jia Zeng,Junting Dong,Dahua Lin,Jiangmiao Pang
発行日 2025-04-28 09:21:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO | HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit はコメントを受け付けていません

ARMOR: Adaptive Meshing with Reinforcement Optimization for Real-time 3D Monitoring in Unexposed Scenes

要約

溶岩チューブ、鉱山、トンネルなどの暴露された環境は、科学的探査とインフラ開発のための最も複雑でありながら戦略的に重要なドメインの1つです。
これらの環境の正確かつリアルタイムの3Dメッシュは、自動構造評価、ロボット支援検査、安全監視などのアプリケーションに不可欠です。
暗黙のニューラル署名距離フィールド(SDF)は、オンラインメッシュに有望な機能を示しています。
ただし、既存の方法は、多くの場合、大きな投影エラーに悩まされ、固定再建パラメーターに依存しており、トンネル、洞窟、溶岩チューブなどの複雑で非構造化されていない地下環境への適応性を制限します。
これらの課題に対処するために、このペーパーでは、暴露された環境でのリアルタイム3Dメッシュのためのシーンに適合した補強学習ベースのフレームワークであるアーマーを提案します。
提案された方法は、エンジニアリングされたトンネル、自然洞窟、溶岩管など、3,000メートル以上の地下環境で検証されました。
実験結果は、アーマーがリアルタイムメッシュ再構成で優れた性能を達成し、リアルタイムの効率を維持しながら、最先端のベースラインと比較して幾何学的誤差を3.96 \%減らすことを示しています。
この方法は、堅牢性、精度、適応性を改善し、挑戦的な暴露シナリオでの高度な3Dモニタリングとマッピングの可能性を示しています。
プロジェクトページは、https://yizhezhang0418.github.io/armor.github.io/にあります。

要約(オリジナル)

Unexposed environments, such as lava tubes, mines, and tunnels, are among the most complex yet strategically significant domains for scientific exploration and infrastructure development. Accurate and real-time 3D meshing of these environments is essential for applications including automated structural assessment, robotic-assisted inspection, and safety monitoring. Implicit neural Signed Distance Fields (SDFs) have shown promising capabilities in online meshing; however, existing methods often suffer from large projection errors and rely on fixed reconstruction parameters, limiting their adaptability to complex and unstructured underground environments such as tunnels, caves, and lava tubes. To address these challenges, this paper proposes ARMOR, a scene-adaptive and reinforcement learning-based framework for real-time 3D meshing in unexposed environments. The proposed method was validated across more than 3,000 meters of underground environments, including engineered tunnels, natural caves, and lava tubes. Experimental results demonstrate that ARMOR achieves superior performance in real-time mesh reconstruction, reducing geometric error by 3.96\% compared to state-of-the-art baselines, while maintaining real-time efficiency. The method exhibits improved robustness, accuracy, and adaptability, indicating its potential for advanced 3D monitoring and mapping in challenging unexposed scenarios. The project page can be found at: https://yizhezhang0418.github.io/armor.github.io/

arxiv情報

著者 Yizhe Zhang,Jianping Li,Xin Zhao,Fuxun Liang,Zhen Dong,Bisheng Yang
発行日 2025-04-28 09:33:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | ARMOR: Adaptive Meshing with Reinforcement Optimization for Real-time 3D Monitoring in Unexposed Scenes はコメントを受け付けていません

Robot Motion Planning using One-Step Diffusion with Noise-Optimized Approximate Motions

要約

このペーパーでは、ワンステップ拡散モデルを使用した画像ベースのロボットモーション計画方法を提案します。
拡散モデルは高品質のモーション生成を可能にしますが、その計算コストは​​高すぎてロボットをリアルタイムで制御するには高すぎます。
同時に高品質と効率を達成するために、ワンステップ拡散モデルは、入力画像から直接予測されるほぼ生成された動きを採用します。
このおおよその動きは、私たちの新しいノイズオプティマイザーによって提供される添加剤ノイズによって最適化されています。
一般的な等方性ノイズとは異なり、ノイズオプティマイザーは、各動き要素の不確実性に応じて、非異方性にノイズを調整します。
私たちの実験結果は、私たちの方法が、ワンステップ拡散によってその効率を維持しながら、最先端の方法よりも優れていることを示しています。

要約(オリジナル)

This paper proposes an image-based robot motion planning method using a one-step diffusion model. While the diffusion model allows for high-quality motion generation, its computational cost is too expensive to control a robot in real time. To achieve high quality and efficiency simultaneously, our one-step diffusion model takes an approximately generated motion, which is predicted directly from input images. This approximate motion is optimized by additive noise provided by our novel noise optimizer. Unlike general isotropic noise, our noise optimizer adjusts noise anisotropically depending on the uncertainty of each motion element. Our experimental results demonstrate that our method outperforms state-of-the-art methods while maintaining its efficiency by one-step diffusion.

arxiv情報

著者 Tomoharu Aizu,Takeru Oba,Yuki Kondo,Norimichi Ukita
発行日 2025-04-28 10:10:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Robot Motion Planning using One-Step Diffusion with Noise-Optimized Approximate Motions はコメントを受け付けていません

GAN-SLAM: Real-Time GAN Aided Floor Plan Creation Through SLAM

要約

SLAMは、現代の自律システムの基本的な要素であり、ロボットとそのオペレーターに環境をより深く理解することを提供します。
スラムシステムは、ロボット運動の動的な性質のために課題に遭遇することが多く、特に占有グリッドマップなどの2D表現において、品質のマッピングの不正確さにつながります。
これらのエラーは、地図の品質を大幅に分解し、フロアプランの作成などの特定のダウンストリームタスクの有効性を妨げます。
この課題に対処するために、私たちの小説「Gan-Slam」を紹介します。これは、スラムプロセス中に生成的な敵対的なネットワークを活用して占有グリッドをクリーニングおよび完了する新しいスラムアプローチを紹介し、出力マップに導入された騒音と不正確さの影響を減らします。
通常、3Dスラムに使用される正確なポーズ推定技術を2Dフォームに適応させ、統合します。
これにより、高品質の3D LIDAR-ODOMETRYが近年、2D表現に効果的であることが見られています。
我々の結果は、最小限のノイズとエラーを伴うマップの忠実度と品質の大幅な改善を示しており、大規模な複雑な環境内の実際のマッピングアプリケーションに対するGan-Slamの有効性を確認しています。
リアルタイムで動作する実際のデータと、2Dマップの有名な例でのアプローチを検証します。
出力マップの品質が向上すると、フロアプランのドラフトなどの新しいダウンストリームタスクが可能になり、自律システムの機能がさらに向上します。
SLAMへの斬新なアプローチは、フィールドでの大きな前進を提供し、マッピングベースのタスクのSLAMの使いやすさを改善し、OGMエラー修正のためのGANの使用に関する洞察を提供します。

要約(オリジナル)

SLAM is a fundamental component of modern autonomous systems, providing robots and their operators with a deeper understanding of their environment. SLAM systems often encounter challenges due to the dynamic nature of robotic motion, leading to inaccuracies in mapping quality, particularly in 2D representations such as Occupancy Grid Maps. These errors can significantly degrade map quality, hindering the effectiveness of specific downstream tasks such as floor plan creation. To address this challenge, we introduce our novel ‘GAN-SLAM’, a new SLAM approach that leverages Generative Adversarial Networks to clean and complete occupancy grids during the SLAM process, reducing the impact of noise and inaccuracies introduced on the output map. We adapt and integrate accurate pose estimation techniques typically used for 3D SLAM into a 2D form. This enables the quality improvement 3D LiDAR-odometry has seen in recent years to be effective for 2D representations. Our results demonstrate substantial improvements in map fidelity and quality, with minimal noise and errors, affirming the effectiveness of GAN-SLAM for real-world mapping applications within large-scale complex environments. We validate our approach on real-world data operating in real-time, and on famous examples of 2D maps. The improved quality of the output map enables new downstream tasks, such as floor plan drafting, further enhancing the capabilities of autonomous systems. Our novel approach to SLAM offers a significant step forward in the field, improving the usability for SLAM in mapping-based tasks, and offers insight into the usage of GANs for OGM error correction.

arxiv情報

著者 Leon Davies,Baihua Li,Mohamad Saada,Simon Sølvsten,Qinggang Meng
発行日 2025-04-28 10:13:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | GAN-SLAM: Real-Time GAN Aided Floor Plan Creation Through SLAM はコメントを受け付けていません