Reinforcement Learning Approach to Optimizing Profilometric Sensor Trajectories for Surface Inspection

要約

製造における高精度の表面欠陥検出は、品質管理を確保するために不可欠です。
レーザー三角測量形状測定センサーはこのプロセスの鍵となり、ライン上の詳細かつ正確な表面測定を提供します。
完全かつ正確な表面スキャンを実現するには、センサーとワークピース間の正確な相対運動が必要です。
表面に対する最適な距離と相対的な向きを維持するには、センサーの姿勢を制御することが重要です。
スキャンプロセス全体を通じて均一なプロファイル分布を確保することも重要です。
この論文では、形状測定センサーのロボット検査軌道を最適化するための新しい強化学習 (RL) ベースのアプローチを紹介します。
ブーストロフェドン スキャニング法に基づいて構築された当社の技術は、センサーの位置と傾きを動的に調整して、表面からの最適な向きと距離を維持すると同時に、均一で高品質なスキャニングのために一貫したプロファイル距離を確保します。
部品の CAD モデルに基づくシミュレーション環境を利用して、センサーのノイズや表面の凹凸など、現実世界のスキャン条件を再現します。
このシミュレーションベースのアプローチにより、CAD モデルに基づいたオフライン軌道計画が可能になります。
主な貢献には、状態空間、アクション空間、報酬関数のモデリングが含まれており、特に形状測定センサーを使用した検査アプリケーション向けに設計されています。
Proximal Policy Optimization (PPO) アルゴリズムを使用して RL エージェントを効率的にトレーニングし、形状測定センサーを使用して検査軌道を最適化する機能を実証します。
私たちのアプローチを検証するために、特定のトレーニング ピースでトレーニングされたモデルをシミュレーションのさまざまなパーツでテストするいくつかの実験を実施しました。
また、CAD モデルからオフラインで生成された最適化された軌道を実行して、UR3e ロボット アーム モデルを使用して部品を検査する実環境実験も実施しました。

要約(オリジナル)

High-precision surface defect detection in manufacturing is essential for ensuring quality control. Laser triangulation profilometric sensors are key to this process, providing detailed and accurate surface measurements over a line. To achieve a complete and precise surface scan, accurate relative motion between the sensor and the workpiece is required. It is crucial to control the sensor pose to maintain optimal distance and relative orientation to the surface. It is also important to ensure uniform profile distribution throughout the scanning process. This paper presents a novel Reinforcement Learning (RL) based approach to optimize robot inspection trajectories for profilometric sensors. Building upon the Boustrophedon scanning method, our technique dynamically adjusts the sensor position and tilt to maintain optimal orientation and distance from the surface, while also ensuring a consistent profile distance for uniform and high-quality scanning. Utilizing a simulated environment based on the CAD model of the part, we replicate real-world scanning conditions, including sensor noise and surface irregularities. This simulation-based approach enables offline trajectory planning based on CAD models. Key contributions include the modeling of the state space, action space, and reward function, specifically designed for inspection applications using profilometric sensors. We use Proximal Policy Optimization (PPO) algorithm to efficiently train the RL agent, demonstrating its capability to optimize inspection trajectories with profilometric sensors. To validate our approach, we conducted several experiments where a model trained on a specific training piece was tested on various parts in simulation. Also, we conducted a real-world experiment by executing the optimized trajectory, generated offline from a CAD model, to inspect a part using a UR3e robotic arm model.

arxiv情報

著者 Sara Roos-Hoefgeest,Mario Roos-Hoefgeest,Ignacio Alvarez,Rafael C. González
発行日 2024-09-05 11:20:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク