GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

要約

このホワイトペーパーでは、事前計算された3Dガウススプラッティング(3DG)シーンの表現に関してクエリ画像をローカライズする方法を提示します。
まず、このメソッドは3DGSを使用して、最初のポーズ推定で合成RGBD画像をレンダリングします。
第二に、クエリ画像とこの合成画像の間に2D-2Dの対応を確立します。
第三に、深度マップを使用して2D-2Dの対応を2D-3D通信に持ち上げ、Perspective-n-Point(PNP)問題を解決して最終的なポーズ推定値を作成します。
38のシーンと2,700を超えるテスト画像を備えた3つの既存のデータセットにわたる評価の結果は、私たちの方法が、光測定損失の最小化を使用するベースラインメソッドと比較して、推論時間を10秒以上速い速度から0.1秒まで)と推定誤差の両方を大幅に削減することを示しています。
結果はまた、メソッドが回転で最大55 {\ deg}の初期ポーズ推定値と翻訳で1.1ユニット(シーンスケールで正規化)の大きなエラーを許容し、回転で5 {\ deg}の最終的なポーズエラーと0.05ユニットの翻訳で0.05ユニットの最終的なポーズエラーを達成し、シンセティックナーフとMIP-NERF360 DATASの画像からの画像の90%での翻訳で達成することを示しています。
寺院データセット。

要約(オリジナル)

In this paper, we present a method for localizing a query image with respect to a precomputed 3D Gaussian Splatting (3DGS) scene representation. First, the method uses 3DGS to render a synthetic RGBD image at some initial pose estimate. Second, it establishes 2D-2D correspondences between the query image and this synthetic image. Third, it uses the depth map to lift the 2D-2D correspondences to 2D-3D correspondences and solves a perspective-n-point (PnP) problem to produce a final pose estimate. Results from evaluation across three existing datasets with 38 scenes and over 2,700 test images show that our method significantly reduces both inference time (by over two orders of magnitude, from more than 10 seconds to as fast as 0.1 seconds) and estimation error compared to baseline methods that use photometric loss minimization. Results also show that our method tolerates large errors in the initial pose estimate of up to 55{\deg} in rotation and 1.1 units in translation (normalized by scene scale), achieving final pose errors of less than 5{\deg} in rotation and 0.05 units in translation on 90% of images from the Synthetic NeRF and Mip-NeRF360 datasets and on 42% of images from the more challenging Tanks and Temples dataset.

arxiv情報

著者 Jongwon Lee,Timothy Bretl
発行日 2025-04-29 02:48:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting はコメントを受け付けていません

LPVIMO-SAM: Tightly-coupled LiDAR/Polarization Vision/Inertial/Magnetometer/Optical Flow Odometry via Smoothing and Mapping

要約

LiDAR、偏光視覚、慣性測定ユニット、磁力計、および光の流れを統合し、緊密に結合された融合の光流量を統合する、スムージングとマッピング(LPVIMO-SAM)フレームワークを介して、しっかりと結合されたLIDAR/偏光視/磁力計/光フロー臭気を提案します。
このフレームワークにより、LiDARが分解された、低テクスチャ領域、特徴彫像エリアなど、挑戦的な環境で、高精度と非常に堅牢なリアルタイム状態推定とマップ構造が可能になります。
LPVIMO-SAMは、2つのサブシステムで構成されています。偏光視覚系システムと、LIDAR/慣性/磁力計/光学フローシステムです。
偏光視力は、シーンの偏光情報を抽出することにより、低栄養および低テクスチャーシナリオにおける視覚/慣性臭トメトリの堅牢性を高めます。
磁力計は見出し角を取得し、光学流は速度と高さを取得して蓄積された誤差を減らします。
事前因子の磁力計、光学流速度観測係数、および高さの観測係数は、因子グラフの最適化を通じてLIDAR/慣性匂い測定の累積誤差を排除するように設計されています。
一方、LPVIMO-SAMは、2つのサブシステムのいずれかが故障した場合でも安定したポジショニングを維持することができ、LiDARが分解された、低テクスチャ、および低機能環境での適用性をさらに拡大します。
コードはhttps://github.com/junxiaofanchen/lpvimo-samで入手できます。

要約(オリジナル)

We propose a tightly-coupled LiDAR/Polarization Vision/Inertial/Magnetometer/Optical Flow Odometry via Smoothing and Mapping (LPVIMO-SAM) framework, which integrates LiDAR, polarization vision, inertial measurement unit, magnetometer, and optical flow in a tightly-coupled fusion. This framework enables high-precision and highly robust real-time state estimation and map construction in challenging environments, such as LiDAR-degraded, low-texture regions, and feature-scarce areas. The LPVIMO-SAM comprises two subsystems: a Polarized Vision-Inertial System and a LiDAR/Inertial/Magnetometer/Optical Flow System. The polarized vision enhances the robustness of the Visual/Inertial odometry in low-feature and low-texture scenarios by extracting the polarization information of the scene. The magnetometer acquires the heading angle, and the optical flow obtains the speed and height to reduce the accumulated error. A magnetometer heading prior factor, an optical flow speed observation factor, and a height observation factor are designed to eliminate the cumulative errors of the LiDAR/Inertial odometry through factor graph optimization. Meanwhile, the LPVIMO-SAM can maintain stable positioning even when one of the two subsystems fails, further expanding its applicability in LiDAR-degraded, low-texture, and low-feature environments. Code is available on https://github.com/junxiaofanchen/LPVIMO-SAM.

arxiv情報

著者 Derui Shan,Peng Guo,Wenshuo Li,Du Tao
発行日 2025-04-29 02:54:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LPVIMO-SAM: Tightly-coupled LiDAR/Polarization Vision/Inertial/Magnetometer/Optical Flow Odometry via Smoothing and Mapping はコメントを受け付けていません

The Mean of Multi-Object Trajectories

要約

このペーパーでは、軌跡とマルチオブジェクトの軌跡(セットまたはマルチセットの軌跡)の平均の概念を、それらを計算するためのアルゴリズムを紹介します。
具体的には、fr \ ‘{e} chet平均を使用し、最適なサブパターン割り当て(OSPA)コンストラクトに基づいたメトリックを使用して、ベクトルから軌道およびマルチオブジェクトの軌道に平均の概念を拡張します。
さらに、貪欲な検索とギブスサンプリングを使用して、これらの手段を計算するための効率的なアルゴリズムを開発します。
分散マルチオブジェクトトラッキングをアプリケーションとして使用して、マルチオブジェクト軌道コンセンサスに対するFR \ ‘{e} CHET平均アプローチが、最先端の分散マルチオブジェクト追跡方法を大幅に上回ることを実証します。

要約(オリジナル)

This paper introduces the concept of a mean for trajectories and multi-object trajectories–sets or multi-sets of trajectories–along with algorithms for computing them. Specifically, we use the Fr\'{e}chet mean, and metrics based on the optimal sub-pattern assignment (OSPA) construct, to extend the notion of average from vectors to trajectories and multi-object trajectories. Further, we develop efficient algorithms to compute these means using greedy search and Gibbs sampling. Using distributed multi-object tracking as an application, we demonstrate that the Fr\'{e}chet mean approach to multi-object trajectory consensus significantly outperforms state-of-the-art distributed multi-object tracking methods.

arxiv情報

著者 Tran Thien Dat Nguyen,Ba Tuong Vo,Ba-Ngu Vo,Hoa Van Nguyen,Changbeom Shim
発行日 2025-04-29 03:25:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | The Mean of Multi-Object Trajectories はコメントを受け付けていません

Model Predictive Control with Visibility Graphs for Humanoid Path Planning and Tracking Against Adversarial Opponents

要約

この論文では、障害物の回避、経路計画、軌跡追跡に使用される方法について詳しく説明します。これは、ロボカップ2024で大人のサイズの自律型ヒューマノイドサッカーリーグに勝つのに役立ちました。
(FOV)。
さらに、障害物は、計画された軌跡に散発的に飛び出します。
時には、私たちの推定器は、ロボットをハード制約の中に入れます。
また、この競争のプランナーは、リアルタイムで再計画して反応するのに十分な計算上効率でなければなりません。
これにより、軌道の生成と追跡に対するアプローチが動機付けられました。
多くのシナリオでは、長期的および短期的な計画が必要です。
すべての障害を回避する長期的な一般的なパスを効率的に見つけるために、DAVG(動的拡張視認性グラフ)を開発しました。
DAVGは、障害と目的の目標ポーズに基づいて、特定の領域をアクティブにすることにより、重要なパス計画に焦点を当てています。
グラフ内の状態を拡張することにより、回転角度を考慮します。これは、ターニングがよりコストがかかるため、ロボットを演奏する大規模なサッカーにとって重要です。
軌道は、DAVGによって生成された離散点を直線的に補間することによって形成されます。
モデル予測制御(MPC)の修正バージョンを使用して、CF-MPC(衝突なしMPC)と呼ばれるこの軌跡を追跡します。
これにより、短期計画が保証されます。
定式化を切り替えることなく、CF-MPCはロボットのダイナミクスと衝突のない制約を考慮します。
ハードスイッチがなければ、ノイズがロボットを制約境界内に配置する場合、制御入力はスムーズに遷移できます。
非線形定式化は約120 Hzで動作しますが、二次バージョンは約400 Hzを達成します。

要約(オリジナル)

In this paper we detail the methods used for obstacle avoidance, path planning, and trajectory tracking that helped us win the adult-sized, autonomous humanoid soccer league in RoboCup 2024. Our team was undefeated for all seated matches and scored 45 goals over 6 games, winning the championship game 6 to 1. During the competition, a major challenge for collision avoidance was the measurement noise coming from bipedal locomotion and a limited field of view (FOV). Furthermore, obstacles would sporadically jump in and out of our planned trajectory. At times our estimator would place our robot inside a hard constraint. Any planner in this competition must also be be computationally efficient enough to re-plan and react in real time. This motivated our approach to trajectory generation and tracking. In many scenarios long-term and short-term planning is needed. To efficiently find a long-term general path that avoids all obstacles we developed DAVG (Dynamic Augmented Visibility Graphs). DAVG focuses on essential path planning by setting certain regions to be active based on obstacles and the desired goal pose. By augmenting the states in the graph, turning angles are considered, which is crucial for a large soccer playing robot as turning may be more costly. A trajectory is formed by linearly interpolating between discrete points generated by DAVG. A modified version of model predictive control (MPC) is used to then track this trajectory called cf-MPC (Collision-Free MPC). This ensures short-term planning. Without having to switch formulations cf-MPC takes into account the robot dynamics and collision free constraints. Without a hard switch the control input can smoothly transition in cases where the noise places our robot inside a constraint boundary. The nonlinear formulation runs at approximately 120 Hz, while the quadratic version achieves around 400 Hz.

arxiv情報

著者 Ruochen Hou,Gabriel I. Fernandez,Mingzhang Zhu,Dennis W. Hong
発行日 2025-04-29 04:24:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Model Predictive Control with Visibility Graphs for Humanoid Path Planning and Tracking Against Adversarial Opponents はコメントを受け付けていません

SAS-Prompt: Large Language Models as Numerical Optimizers for Robot Self-Improvement

要約

ロボットポリシーの反復的自己改善を実行する大規模な言語モデル(LLM)の能力を実証します。
このペーパーの重要な洞察は、LLMが(確率的)数値最適化を実行する能力を組み込んでおり、このプロパティを説明可能なロボットポリシー検索のために活用できることです。
この洞察に基づいて、SASプロンプト(要約、分析、合成)を紹介します。これは、新しい目に見えない動作を合成するために以前のロボットトレースを取得、推論、最適化するLLMの能力を組み合わせることにより、ロボット行動の反復学習と適応を可能にする単一のプロンプトです。
私たちのアプローチは、LLM内で完全に実装されている説明可能なポリシー検索方法の新しいファミリーの初期の例と見なすことができます。
シミュレーションとレアルロボット卓球タスクの両方でアプローチを評価します。
プロジェクトWebサイト:sites.google.com/asu.edu/sas-llm/

要約(オリジナル)

We demonstrate the ability of large language models (LLMs) to perform iterative self-improvement of robot policies. An important insight of this paper is that LLMs have a built-in ability to perform (stochastic) numerical optimization and that this property can be leveraged for explainable robot policy search. Based on this insight, we introduce the SAS Prompt (Summarize, Analyze, Synthesize) — a single prompt that enables iterative learning and adaptation of robot behavior by combining the LLM’s ability to retrieve, reason and optimize over previous robot traces in order to synthesize new, unseen behavior. Our approach can be regarded as an early example of a new family of explainable policy search methods that are entirely implemented within an LLM. We evaluate our approach both in simulation and on a real-robot table tennis task. Project website: sites.google.com/asu.edu/sas-llm/

arxiv情報

著者 Heni Ben Amor,Laura Graesser,Atil Iscen,David D’Ambrosio,Saminda Abeyruwan,Alex Bewley,Yifan Zhou,Kamalesh Kalirathinam,Swaroop Mishra,Pannag Sanketi
発行日 2025-04-29 06:39:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | SAS-Prompt: Large Language Models as Numerical Optimizers for Robot Self-Improvement はコメントを受け付けていません

DLW-CI: A Dynamic Likelihood-Weighted Cooperative Infotaxis Approach for Multi-Source Search in Urban Environments Using Consumer Drone Networks

要約

低コストセンサーを装備した消費者グレードのドローンは、都市環境での環境監視と有害物質検出のための自律的なインテリジェントシステム(AISS)の基礎として浮上しています。
ただし、既存の研究では、主にシングルソースの検索問題に対処し、危険なソースの場所と量の両方が不明のままである現実世界の都市シナリオの複雑さを見落としています。
この問題に対処するために、消費者ドローンネットワーク向けの動的な尤度加重協同的インフォテキス(DLW-CI)アプローチを提案します。
私たちのアプローチは、Infotaxis(認知検索戦略)と最適化されたソース用語の推定と革新的な協同メカニズムを組み合わせることにより、AISSのマルチドローンコラボレーションを強化します。
具体的には、各フィルターが検索シーン内の潜在的に未知のソースのパラメーターを推定することに特化した複数の並列粒子フィルターを使用する新しいソース用語推定方法を導入します。
さらに、複数のドローンが同じソースを推定および検索するのを防ぐために、動的な尤度の重みに基づいた協調メカニズムを開発し、消費者AIのエネルギー効率と検索カバレッジを最適化します。
実験結果は、DLW-CIアプローチが、障害物の存在に関係なく、比較的少ないソースのシナリオで、成功率、精度、および根平均平方根誤差に関するベースライン方法を大幅に上回ることを示しています。
また、提案されたアプローチの有効性は、計算流体ダイナミクス(CFD)モデルによって生成される拡散シナリオで検証されています。
調査結果は、私たちのアプローチが消費者ドローンベースのAISSによるソースの推定精度と検索効率を改善し、スマートシティインフラストラクチャ内の環境安全監視アプリケーションに貴重な貢献をすることができることを示しています。

要約(オリジナル)

Consumer-grade drones equipped with low-cost sensors have emerged as a cornerstone of Autonomous Intelligent Systems (AISs) for environmental monitoring and hazardous substance detection in urban environments. However, existing research primarily addresses single-source search problems, overlooking the complexities of real-world urban scenarios where both the location and quantity of hazardous sources remain unknown. To address this issue, we propose the Dynamic Likelihood-Weighted Cooperative Infotaxis (DLW-CI) approach for consumer drone networks. Our approach enhances multi-drone collaboration in AISs by combining infotaxis (a cognitive search strategy) with optimized source term estimation and an innovative cooperative mechanism. Specifically, we introduce a novel source term estimation method that utilizes multiple parallel particle filters, with each filter dedicated to estimating the parameters of a potentially unknown source within the search scene. Furthermore, we develop a cooperative mechanism based on dynamic likelihood weights to prevent multiple drones from simultaneously estimating and searching for the same source, thus optimizing the energy efficiency and search coverage of the consumer AIS. Experimental results demonstrate that the DLW-CI approach significantly outperforms baseline methods regarding success rate, accuracy, and root mean square error, particularly in scenarios with relatively few sources, regardless of the presence of obstacles. Also, the effectiveness of the proposed approach is verified in a diffusion scenario generated by the computational fluid dynamics (CFD) model. Research findings indicate that our approach could improve source estimation accuracy and search efficiency by consumer drone-based AISs, making a valuable contribution to environmental safety monitoring applications within smart city infrastructure.

arxiv情報

著者 Xiaoran Zhang,Yatai Ji,Yong Zhao,Chuan Ai,Bin Chen,Zhengqiu Zhu
発行日 2025-04-29 07:14:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.RO, math.IT | DLW-CI: A Dynamic Likelihood-Weighted Cooperative Infotaxis Approach for Multi-Source Search in Urban Environments Using Consumer Drone Networks はコメントを受け付けていません

Adaptive Neural Unscented Kalman Filter

要約

無濃縮カルマンフィルターは、非線形シナリオを処理できるアルゴリズムです。
プロセスノイズ共分散の不確実性は、フィルターの推定パフォーマンスを低下させるか、その分岐に至る可能性があります。
したがって、プロセスノイズ共分散マトリックスをリアルタイムで調整することが重要です。
この論文では、プラットフォーム操作中に時変不確実性に対処するために、適応性のある神経の無香料のカルマンフィルターを開発しました。
この目的のために、プロセスノイズ共分散マトリックスを適応的に推定するために、シンプルでありながら効率的なエンドツーエンド回帰ネットワークであるProcessNetを考案しました。
自律的な水中車両ナビゲーションの場合、非線形慣性センサーとドップラー速度ログ融合問題に焦点を当てました。
自律的な水中車両からの実際の記録されたデータセットを使用して、フィルターのパフォーマンスを実証し、他の適応型および非適応性のない非線形フィルターに対する利点を示しました。

要約(オリジナル)

The unscented Kalman filter is an algorithm capable of handling nonlinear scenarios. Uncertainty in process noise covariance may decrease the filter estimation performance or even lead to its divergence. Therefore, it is important to adjust the process noise covariance matrix in real time. In this paper, we developed an adaptive neural unscented Kalman filter to cope with time-varying uncertainties during platform operation. To this end, we devised ProcessNet, a simple yet efficient end-to-end regression network to adaptively estimate the process noise covariance matrix. We focused on the nonlinear inertial sensor and Doppler velocity log fusion problem in the case of autonomous underwater vehicle navigation. Using a real-world recorded dataset from an autonomous underwater vehicle, we demonstrated our filter performance and showed its advantages over other adaptive and non-adaptive nonlinear filters.

arxiv情報

著者 Amit Levy,Itzik Klein
発行日 2025-04-29 07:15:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | Adaptive Neural Unscented Kalman Filter はコメントを受け付けていません

Combining Quality of Service and System Health Metrics in MAPE-K based ROS Systems through Behavior Trees

要約

近年、ロボット工学の分野は、構造化された環境での動作から動的で予測不可能な設定の処理に大きな変化をもたらしました。
これらの課題に取り組むために、これらのシステムが実行時に予期せぬ状況に対応できるようにする自己適応システムの分野からの方法論が適用されています。
知識(MAPE-K)フィードバックループモデルをめぐる監視 – 分析 – 計画 – 解釈は、多くの場合、管理されたサブシステムの監視と適応を担当する管理サブシステムに実装される一般的なアプローチです。
この作業では、ロボットオペレーティングシステム2(ROS2)フレームワーク内の動作ツリー(BTS)に基づいて、MAPE-Kフィードバックループの実装を調査します。
マネージドとマネージャーのサブシステムを描写することにより、当社のアプローチはROSベースのシステムの柔軟性と適応性を高め、サービス品質(QOS)を満たすだけでなく、システムの健康メトリック要件、つまりROSノードと通信チャネルの可用性も確実にします。
実装により、特定のルールセット内で目的の動作を構成できるため、カスタムBTノードを必要とせずに新しい管理されたサブシステムにメソッドを適用できます。
空中知覚ユースケースを示すシステムに関するさまざまな実験を通じて、方法の有効性を実証します。
さまざまな障害ケースを評価することにより、認識品質の向上とシステムの可用性の両方を示します。
私たちのコードはオープンソースです

要約(オリジナル)

In recent years, the field of robotics has witnessed a significant shift from operating in structured environments to handling dynamic and unpredictable settings. To tackle these challenges, methodologies from the field of self-adaptive systems enabling these systems to react to unforeseen circumstances during runtime have been applied. The Monitoring-Analysis- Planning-Execution over Knowledge (MAPE-K) feedback loop model is a popular approach, often implemented in a managing subsystem, responsible for monitoring and adapting a managed subsystem. This work explores the implementation of the MAPE- K feedback loop based on Behavior Trees (BTs) within the Robot Operating System 2 (ROS2) framework. By delineating the managed and managing subsystems, our approach enhances the flexibility and adaptability of ROS-based systems, ensuring they not only meet Quality-of-Service (QoS), but also system health metric requirements, namely availability of ROS nodes and communication channels. Our implementation allows for the application of the method to new managed subsystems without needing custom BT nodes as the desired behavior can be configured within a specific rule set. We demonstrate the effectiveness of our method through various experiments on a system showcasing an aerial perception use case. By evaluating different failure cases, we show both an increased perception quality and a higher system availability. Our code is open source

arxiv情報

著者 Andreas Wiedholz,Rafael Paintner,Julian Gleißner,Alwin Hoffmann
発行日 2025-04-29 07:19:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Combining Quality of Service and System Health Metrics in MAPE-K based ROS Systems through Behavior Trees はコメントを受け付けていません

Hook-Based Aerial Payload Grasping from a Moving Platform

要約

このペーパーでは、フック装備の空中マニピュレーターを使用して、移動プラットフォームからのペイロードグレースを調査します。
第一に、最適な把握時間を決定するために、相補性の制約に基づいた計算効率的な軌道最適化が提案されています。
複雑で動的に変化する環境でアプリケーションを有効にするために、Physics Simulatorベースのモデルを使用して、ペイロードの将来の動きが予測されます。
モデルの不確実性と外部障害の下でのペイロード把握の成功は、統合的な二次制約に基づく堅牢性分析方法を通じて正式に検証されます。
提案されたアルゴリズムは、高忠実度の物理シミュレータで評価され、カスタム設計された空中マニピュレータープラットフォームを使用した実際の飛行実験で評価されます。

要約(オリジナル)

This paper investigates payload grasping from a moving platform using a hook-equipped aerial manipulator. First, a computationally efficient trajectory optimization based on complementarity constraints is proposed to determine the optimal grasping time. To enable application in complex, dynamically changing environments, the future motion of the payload is predicted using a physics simulator-based model. The success of payload grasping under model uncertainties and external disturbances is formally verified through a robustness analysis method based on integral quadratic constraints. The proposed algorithms are evaluated in a high-fidelity physical simulator, and in real flight experiments using a custom-designed aerial manipulator platform.

arxiv情報

著者 Péter Antal,Tamás Péni,Roland Tóth
発行日 2025-04-29 07:34:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Hook-Based Aerial Payload Grasping from a Moving Platform はコメントを受け付けていません

SPARK Hand: Scooping-Pinching Adaptive Robotic Hand with Kempe Mechanism for Vertical Passive Grasp in Environmental Constraints

要約

このペーパーでは、並行してピンチとスクープの両方の握りを実行できる革新的なパッシブ適応ロボットフィンガーであるスパークフィンガーを紹介します。
スパークフィンガーには、Kempeリンケージを備えたマルチリンクメカニズムが組み込まれており、垂直線形指先の軌跡を実現します。
さらに、平行四辺形のリンケージにより、指先がベースと比較して固定された方向を維持し、正確で安定した操作を促進します。
これらのメカニズムを弾性要素と統合することにより、設計により、卓上などの表面との効果的な相互作用が可能になり、挑戦的なオブジェクトを処理できます。
指は、ピンチモードとスクープモードの間のシームレスな遷移を容易にするパッシブスイッチングメカニズムを採用し、追加のアクチュエーターなしでさまざまなオブジェクト形状と環境制約に自動的に適応します。
その汎用性を示すために、2つの火花指を備えたスパークハンドが開発されました。
このシステムは、多様なサイズと形状のオブジェクト、特に従来のグリッパーにとって伝統的に挑戦的な薄くてフラットなオブジェクトの握りパフォーマンスと安定性を高めます。
実験結果は、Spark Designの有効性を検証し、制約された動的環境でのロボット操作の可能性を強調します。

要約(オリジナル)

This paper presents the SPARK finger, an innovative passive adaptive robotic finger capable of executing both parallel pinching and scooping grasps. The SPARK finger incorporates a multi-link mechanism with Kempe linkages to achieve a vertical linear fingertip trajectory. Furthermore, a parallelogram linkage ensures the fingertip maintains a fixed orientation relative to the base, facilitating precise and stable manipulation. By integrating these mechanisms with elastic elements, the design enables effective interaction with surfaces, such as tabletops, to handle challenging objects. The finger employs a passive switching mechanism that facilitates seamless transitions between pinching and scooping modes, adapting automatically to various object shapes and environmental constraints without additional actuators. To demonstrate its versatility, the SPARK Hand, equipped with two SPARK fingers, has been developed. This system exhibits enhanced grasping performance and stability for objects of diverse sizes and shapes, particularly thin and flat objects that are traditionally challenging for conventional grippers. Experimental results validate the effectiveness of the SPARK design, highlighting its potential for robotic manipulation in constrained and dynamic environments.

arxiv情報

著者 Jiaqi Yin,Tianyi Bi,Wenzeng Zhang
発行日 2025-04-29 07:47:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | SPARK Hand: Scooping-Pinching Adaptive Robotic Hand with Kempe Mechanism for Vertical Passive Grasp in Environmental Constraints はコメントを受け付けていません