要約
ROS (ロボット オペレーティング システム) パッケージは、ロボット ソフトウェア開発で効果的に再利用できるソフトウェア アーティファクトの一種としてますます人気が高まっています。
実際、現在の検索方法を使用すると、膨大な数の利用可能なパッケージの中からソフトウェアの機能要件に厳密に一致する適切な ROS パッケージを見つけることは簡単な作業ではありません。
ROS パッケージの従来の検索方法では、多くの場合、ロボット タスクに関連するキーワードを汎用検索エンジンまたはコード ホスティング プラットフォームに入力して、適切な可能性のあるすべての ROS パッケージのおおよその結果を取得します。
ただし、タスク関連のキーワードが ROS パッケージによって提供される機能と正確に一致しない可能性があるため、これらの検索方法の精度は比較的低いままです。
ROS パッケージの検索精度を向上させるために、この論文では、セマンティック レベルの ROS Package Knowledge Graph (RPKG) に依存して、最適な ROS パッケージを自動的に取得する、新しいセマンティック ベースの検索アプローチを紹介します。
まず、RPKG を構築するために、多次元特徴抽出技術を使用して、ROS パッケージのテキスト記述のデータセットから意味概念を抽出します。
このプロセスから抽出された意味論的特徴により、相当数のエンティティと関係が生成されます。
続いて、ロボット ドメイン固有の小さなコーパスを作成し、事前トレーニングされた言語モデル BERT-ROS をさらに微調整して、抽出された特徴のセマンティクスを効果的に表すエンベディングを生成します。
これらの埋め込みは、RPKG 内での ROS パッケージ検索プロセス中のセマンティック レベルの理解と比較を容易にする上で重要な役割を果たします。
次に、ユーザーの検索クエリからの複数の機能の重み付けされた類似性を組み込んだ、新しいセマンティック マッチング ベースの検索アルゴリズムを導入します。これにより、従来のキーワード検索方法よりも正確な ROS パッケージが検索されます。
要約(オリジナル)
ROS (Robot Operating System) packages have become increasingly popular as a type of software artifact that can be effectively reused in robotic software development. Indeed, finding suitable ROS packages that closely match the software’s functional requirements from the vast number of available packages is a nontrivial task using current search methods. The traditional search methods for ROS packages often involve inputting keywords related to robotic tasks into general-purpose search engines or code hosting platforms to obtain approximate results of all potentially suitable ROS packages. However, the accuracy of these search methods remains relatively low because the task-related keywords may not precisely match the functionalities offered by the ROS packages. To improve the search accuracy of ROS packages, this paper presents a novel semantic-based search approach that relies on the semantic-level ROS Package Knowledge Graph (RPKG) to automatically retrieve the most suitable ROS packages. Firstly, to construct the RPKG, we employ multi-dimensional feature extraction techniques to extract semantic concepts from the dataset of ROS package text descriptions. The semantic features extracted from this process result in a substantial number of entities and relationships. Subsequently, we create a robot domain-specific small corpus and further fine-tune a pre-trained language model, BERT-ROS, to generate embeddings that effectively represent the semantics of the extracted features. These embeddings play a crucial role in facilitating semantic-level understanding and comparisons during the ROS package search process within the RPKG. Secondly, we introduce a novel semantic matching-based search algorithm that incorporates the weighted similarities of multiple features from user search queries, which searches out more accurate ROS packages than the traditional keyword search method.
arxiv情報
著者 | Shuo Wang,Xinjun Mao,Shuo Yang,Menghan Wu,Zhang Zhang |
発行日 | 2023-12-22 15:50:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google