Reinforcement Learning Approach to Optimizing Profilometric Sensor Trajectories for Surface Inspection


この論文では、形状測定センサーのロボット検査軌道を最適化するための新しい強化学習 (RL) ベースのアプローチを紹介します。
ブーストロフェドン スキャニング法に基づいて構築された当社の技術は、センサーの位置と傾きを動的に調整して、表面からの最適な向きと距離を維持すると同時に、均一で高品質なスキャニングのために一貫したプロファイル距離を確保します。
部品の CAD モデルに基づくシミュレーション環境を利用して、センサーのノイズや表面の凹凸など、現実世界のスキャン条件を再現します。
このシミュレーションベースのアプローチにより、CAD モデルに基づいたオフライン軌道計画が可能になります。
Proximal Policy Optimization (PPO) アルゴリズムを使用して RL エージェントを効率的にトレーニングし、形状測定センサーを使用して検査軌道を最適化する機能を実証します。
私たちのアプローチを検証するために、特定のトレーニング ピースでトレーニングされたモデルをシミュレーションのさまざまなパーツでテストするいくつかの実験を実施しました。
また、CAD モデルからオフラインで生成された最適化された軌道を実行して、UR3e ロボット アーム モデルを使用して部品を検査する実環境実験も実施しました。


High-precision surface defect detection in manufacturing is essential for ensuring quality control. Laser triangulation profilometric sensors are key to this process, providing detailed and accurate surface measurements over a line. To achieve a complete and precise surface scan, accurate relative motion between the sensor and the workpiece is required. It is crucial to control the sensor pose to maintain optimal distance and relative orientation to the surface. It is also important to ensure uniform profile distribution throughout the scanning process. This paper presents a novel Reinforcement Learning (RL) based approach to optimize robot inspection trajectories for profilometric sensors. Building upon the Boustrophedon scanning method, our technique dynamically adjusts the sensor position and tilt to maintain optimal orientation and distance from the surface, while also ensuring a consistent profile distance for uniform and high-quality scanning. Utilizing a simulated environment based on the CAD model of the part, we replicate real-world scanning conditions, including sensor noise and surface irregularities. This simulation-based approach enables offline trajectory planning based on CAD models. Key contributions include the modeling of the state space, action space, and reward function, specifically designed for inspection applications using profilometric sensors. We use Proximal Policy Optimization (PPO) algorithm to efficiently train the RL agent, demonstrating its capability to optimize inspection trajectories with profilometric sensors. To validate our approach, we conducted several experiments where a model trained on a specific training piece was tested on various parts in simulation. Also, we conducted a real-world experiment by executing the optimized trajectory, generated offline from a CAD model, to inspect a part using a UR3e robotic arm model.


著者 Sara Roos-Hoefgeest,Mario Roos-Hoefgeest,Ignacio Alvarez,Rafael C. González
発行日 2024-09-05 11:20:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.RO パーマリンク