Embedding-based search in JetBrains IDEs

要約

最新の統合開発環境 (IDE) とコード エディターのほとんどには、開いているプロジェクトで使用可能な機能と項目を検索する機能があります。
JetBrains IDE では、この機能は Search Everywhere と呼ばれます。これにより、ユーザーは単一のエントリ ポイントからファイル、アクション、クラス、シンボル、設定、および VCS 履歴のあらゆるものを検索できます。
ただし、同義語、複雑な単語の並べ替え、音声の一部の変更、タイプミスなどの意味論を考慮しないアルゴリズムによって取得された候補には機能します。
この研究では、検索項目の発見可能性を向上させるために実装した機械学習アプローチについて説明します。
また、このプロセス中に遭遇した障害と、それらをどのように克服したかについても共有します。

要約(オリジナル)

Most modern Integrated Development Environments (IDEs) and code editors have a feature to search across available functionality and items in an open project. In JetBrains IDEs, this feature is called Search Everywhere: it allows users to search for files, actions, classes, symbols, settings, and anything from VCS history from a single entry point. However, it works with the candidates obtained by algorithms that don’t account for semantics, e.g., synonyms, complex word permutations, part of the speech modifications, and typos. In this work, we describe the machine learning approach we implemented to improve the discoverability of search items. We also share the obstacles encountered during this process and how we overcame them.

arxiv情報

著者 Evgeny Abramov,Nikolai Palchikov
発行日 2024-01-26 16:07:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG, cs.SE パーマリンク