Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning

要約

能動的な3Dシーン表現は、遠隔検査、マニピュレーション、テレプレゼンスなど、最新のロボット工学アプリケーションにおいて極めて重要です。従来の手法は、主に幾何学的忠実度やレンダリング精度を最適化しますが、安全性が重要なカバレッジやタスク主導の視点など、オペレータ固有の目的を見落とすことがよくあります。この限界は、特に原子力発電所の廃止措置のような制約のある環境において、最適とは言えない視点選択につながる。このギャップを埋めるために、我々は、アクティブな3Dシーン表現パイプラインに専門家のオペレータの嗜好を統合する新しいフレームワークを導入する。具体的には、人間のフィードバックからの強化学習(RLHF)を採用し、専門家の入力に基づいて報酬関数を再形成し、ロボットの経路計画をガイドする。オペレータ固有の優先順位を捉えるために、3Dシーン表現におけるユーザの嗜好を評価する対話型選択実験を行う。原子力発電所の廃炉シナリオにおいて、原子炉タイルの検査にUR3eロボットアームを用いて、我々のフレームワークを検証する。ベースライン手法と比較して、我々のアプローチは軌道効率を最適化しながらシーン表現を強化する。RLHFに基づく方針は、タスククリティカルな詳細を優先し、ランダム選択を常に上回る。明示的な3D幾何学モデリングと暗黙的なヒューマン・イン・ザ・ループ最適化を統合することで、本研究は、適応的でセーフティクリティカルなロボット知覚システムの基盤を確立し、原子力廃止措置、遠隔保守、およびその他の高リスク環境における自動化強化への道を開く。

要約(オリジナル)

Active 3D scene representation is pivotal in modern robotics applications, including remote inspection, manipulation, and telepresence. Traditional methods primarily optimize geometric fidelity or rendering accuracy, but often overlook operator-specific objectives, such as safety-critical coverage or task-driven viewpoints. This limitation leads to suboptimal viewpoint selection, particularly in constrained environments such as nuclear decommissioning. To bridge this gap, we introduce a novel framework that integrates expert operator preferences into the active 3D scene representation pipeline. Specifically, we employ Reinforcement Learning from Human Feedback (RLHF) to guide robotic path planning, reshaping the reward function based on expert input. To capture operator-specific priorities, we conduct interactive choice experiments that evaluate user preferences in 3D scene representation. We validate our framework using a UR3e robotic arm for reactor tile inspection in a nuclear decommissioning scenario. Compared to baseline methods, our approach enhances scene representation while optimizing trajectory efficiency. The RLHF-based policy consistently outperforms random selection, prioritizing task-critical details. By unifying explicit 3D geometric modeling with implicit human-in-the-loop optimization, this work establishes a foundation for adaptive, safety-critical robotic perception systems, paving the way for enhanced automation in nuclear decommissioning, remote maintenance, and other high-risk environments.

arxiv情報

著者 Zhen Meng,Kan Chen,Xiangmin Xu,Erwin Jose Lopez Pulgarin,Emma Li,Philip G. Zhao,David Flynn
発行日 2025-04-02 22:20:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク