Integrated Drill Boom Hole-Seeking Control via Reinforcement Learning

要約

インテリジェントなドリルブームの穴探索は、掘削効率を向上させ、潜在的な安全上の危険を軽減し、オペレータの負担を軽減する有望な技術である。既存のインテリジェントドリルブーム制御手法のほとんどは、インバースキネマティクスに基づく階層的制御フレームワークに依存している。しかし、これらの方法は、インバースキネマティクスの計算の複雑さと、複数のジョイントの逐次実行の非効率性により、一般に時間がかかる。本研究では、これらの課題に対処するため、強化学習(RL)に基づく統合ドリルブーム制御法を提案する。この統合ドリルブーム制御フレームワークは、パラメータ化されたポリシーを利用し、各時間ステップにおいて、関節の姿勢と目標穴の情報を利用して、全ての関節の制御入力を直接生成する。穴探索タスクをマルコフ決定過程として定式化することにより、現在主流のRLアルゴリズムを穴探索ポリシーの学習に直接用いることができ、逆運動学解法の必要性を排除し、協調的な多関節制御を促進する。穴あけプロセス全体を通して穴あけ精度を向上させるために、我々はDenavit-Hartenberg関節情報とプレビュー穴探し不一致データを組み合わせた状態表現を考案した。シミュレーションの結果、提案手法は穴探し精度と時間効率の点で従来の手法を大幅に上回ることが示された。

要約(オリジナル)

Intelligent drill boom hole-seeking is a promising technology for enhancing drilling efficiency, mitigating potential safety hazards, and relieving human operators. Most existing intelligent drill boom control methods rely on a hierarchical control framework based on inverse kinematics. However, these methods are generally time-consuming due to the computational complexity of inverse kinematics and the inefficiency of the sequential execution of multiple joints. To tackle these challenges, this study proposes an integrated drill boom control method based on Reinforcement Learning (RL). We develop an integrated drill boom control framework that utilizes a parameterized policy to directly generate control inputs for all joints at each time step, taking advantage of joint posture and target hole information. By formulating the hole-seeking task as a Markov decision process, contemporary mainstream RL algorithms can be directly employed to learn a hole-seeking policy, thus eliminating the need for inverse kinematics solutions and promoting cooperative multi-joint control. To enhance the drilling accuracy throughout the entire drilling process, we devise a state representation that combines Denavit-Hartenberg joint information and preview hole-seeking discrepancy data. Simulation results show that the proposed method significantly outperforms traditional methods in terms of hole-seeking accuracy and time efficiency.

arxiv情報

著者 Haoqi Yan,Haoyuan Xu,Hongbo Gao,Fei Ma,Shengbo Eben Li,Jingliang Duan
発行日 2023-12-04 12:16:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO パーマリンク