このペーパーでは、Word2Vec と Annoy Index を使用して大規模なデータセットからの情報検索の効率を向上させる、新しいセマンティック検索アルゴリズムを紹介します。
最大 100 GB のデータセットでのテストにより、高精度とパフォーマンスを維持しながら膨大な量のデータを処理するこの方法の有効性が実証されました。
This paper introduces a new semantic search algorithm that uses Word2Vec and Annoy Index to improve the efficiency of information retrieval from large datasets. The proposed approach addresses the limitations of traditional search methods by offering enhanced speed, accuracy, and scalability. Testing on datasets up to 100GB demonstrates the method’s effectiveness in processing vast amounts of data while maintaining high precision and performance.
著者 | Aryan Duhan,Aryan Singhal,Shourya Sharma,Neeraj,Arti MK |
発行日 | 2024-12-09 16:43:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google