A Predictive Approach for Enhancing Accuracy in Remote Robotic Surgery Using Informer Model


触覚インターネット (TI) 環境での遠隔ロボット手術の成功には、患者側のロボット アームの位置を正確かつリアルタイムで推定することが不可欠です。
このペーパーでは、正確かつ効率的な位置推定のための、Transformer ベースの Informer フレームワークに基づく予測モデルを紹介します。
さらに、4 状態隠れマルコフ モデル (4 状態 HMM) を組み合わせて、現実的なパケット損失シナリオをシミュレートします。
このメソッドは、微分可能な最適化レイヤーを使用して、エネルギー効率、滑らかさ、ロバスト性などの制約をトレーニング プロセスに埋め込むことで、最適化問題を Informer モデルに統合します。
Informer フレームワークは、ProbSparse アテンション、アテンション蒸留、生成スタイル デコーダーなどの機能を使用して、O(L log L) という低い計算量を維持しながら、位置に重要な特徴に焦点を当てます。
この方法は JIGSAWS データセットを使用して評価され、さまざまなネットワーク シナリオの下で 90% 以上の予測精度を達成しています。
TCN、RNN、LSTM などのモデルと比較すると、Informer フレームワークが位置予測の処理とリアルタイム要件を満たす優れたパフォーマンスを示し、触覚インターネット対応のロボット手術に適していることがわかります。


Precise and real-time estimation of the robotic arm’s position on the patient’s side is essential for the success of remote robotic surgery in Tactile Internet (TI) environments. This paper presents a prediction model based on the Transformer-based Informer framework for accurate and efficient position estimation. Additionally, it combines a Four-State Hidden Markov Model (4-State HMM) to simulate realistic packet loss scenarios. The proposed approach addresses challenges such as network delays, jitter, and packet loss to ensure reliable and precise operation in remote surgical applications. The method integrates the optimization problem into the Informer model by embedding constraints such as energy efficiency, smoothness, and robustness into its training process using a differentiable optimization layer. The Informer framework uses features such as ProbSparse attention, attention distilling, and a generative-style decoder to focus on position-critical features while maintaining a low computational complexity of O(L log L). The method is evaluated using the JIGSAWS dataset, achieving a prediction accuracy of over 90 percent under various network scenarios. A comparison with models such as TCN, RNN, and LSTM demonstrates the Informer framework’s superior performance in handling position prediction and meeting real-time requirements, making it suitable for Tactile Internet-enabled robotic surgery.


著者 Muhammad Hanif Lashari,Shakil Ahmed,Wafa Batayneh,Ashfaq Khokhar
発行日 2025-01-24 17:57:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク