VecCity: A Taxonomy-guided Library for Map Entity Representation Learning

要約

電子マップは、関心のあるポイント(POI)、道路ネットワーク、土地区画などの多様なエンティティで構成され、ITやLBSなどのアプリケーションで重要な役割を果たしています。
MAPエンティティ表現学習(MAPRL)は、多用途で再利用可能なデータ表現を生成し、MAPエンティティデータを効率的に管理および利用するための不可欠なツールを提供します。
MAPRLの進歩にもかかわらず、2つの重要な課題がさらなる開発を制約します。
まず、既存の研究は断片化されており、モデルはMAPエンティティのタイプによって分類され、さまざまなタスクにわたるテクニックの再利用性を制限します。
第二に、統一されたベンチマークがないため、モデルの体系的な評価と比較が困難になります。
これらの課題に対処するために、エンコーダー、トレーニング前のタスク、および下流のタスクに基づいてモデルを整理するMAPRLの新しい分類法を提案します。
この分類法に基づいて、分類駆動型のライブラリであるVeccityを紹介します。これは、エンコード、プリトレーニング、微調整、および評価のための使いやすいインターフェイスを提供します。
ライブラリは、9つの都市のデータセットを統合し、21の主流MAPRLモデルを再現し、フィールドの最初の標準化されたベンチマークを確立します。
また、Veccityを使用すると、ユーザーはモジュラーコンポーネントを介してモデルを変更および拡張し、シームレスな実験を促進することもできます。
当社の包括的な実験は、さまざまなタイプのマップエンティティをカバーし、さまざまな下流タスクにわたって21のVeccity事前に構築されたモデルを評価します。
実験結果は、モデル開発の合理化におけるVeccityの有効性を示し、パフォーマンスに対するさまざまなコンポーネントの影響に関する洞察を提供します。
モジュラーの設計と再利用性を促進することにより、VeccityはMAPRLの研究と革新を促進するための統一されたフレームワークを提供します。
このコードは、https://github.com/bigscity-veccity/veccityで入手できます。

要約(オリジナル)

Electronic maps consist of diverse entities, such as points of interest (POIs), road networks, and land parcels, playing a vital role in applications like ITS and LBS. Map entity representation learning (MapRL) generates versatile and reusable data representations, providing essential tools for efficiently managing and utilizing map entity data. Despite the progress in MapRL, two key challenges constrain further development. First, existing research is fragmented, with models classified by the type of map entity, limiting the reusability of techniques across different tasks. Second, the lack of unified benchmarks makes systematic evaluation and comparison of models difficult. To address these challenges, we propose a novel taxonomy for MapRL that organizes models based on functional module-such as encoders, pre-training tasks, and downstream tasks-rather than by entity type. Building on this taxonomy, we present a taxonomy-driven library, VecCity, which offers easy-to-use interfaces for encoding, pre-training, fine-tuning, and evaluation. The library integrates datasets from nine cities and reproduces 21 mainstream MapRL models, establishing the first standardized benchmarks for the field. VecCity also allows users to modify and extend models through modular components, facilitating seamless experimentation. Our comprehensive experiments cover multiple types of map entities and evaluate 21 VecCity pre-built models across various downstream tasks. Experimental results demonstrate the effectiveness of VecCity in streamlining model development and provide insights into the impact of various components on performance. By promoting modular design and reusability, VecCity offers a unified framework to advance research and innovation in MapRL. The code is available at https://github.com/Bigscity-VecCity/VecCity.

arxiv情報

著者 Wentao Zhang,Jingyuan Wang,Yifan Yang,Leong Hou U
発行日 2025-05-07 12:26:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク