V3Det Challenge 2024 on Vast Vocabulary and Open Vocabulary Object Detection: Methods and Results

要約

現実世界のシーンでオブジェクトを検出することは、広範囲にわたるオブジェクト カテゴリや、未知のオブジェクトや見たことのないオブジェクトと遭遇する可能性など、さまざまな課題があるため、複雑なタスクです。
この課題には、公開ベンチマークの開発と、物体検出の分野を進歩させるための課題が必要です。
以前の COCO および LVIS チャレンジの成功に触発され、米国シアトルで開催される CVPR 2024 での第 4 回オープンワールド ビジョン ワークショップ: オープンワールドでの学習による視覚認識 (VPLOW) と連動して、V3Det チャレンジ 2024 を開催します。
この挑戦は、物体検出研究の限界を押し広げ、この分野の革新を促進することを目的としています。
V3Det Challenge 2024 は 2 つのトラックで構成されています。 1) 膨大な語彙のオブジェクト検出: このトラックは、13204 のカテゴリの大規模なセットからオブジェクトを検出することに焦点を当て、さまざまなオブジェクトを認識して位置を特定する検出アルゴリズムの能力をテストします。
2) オープン語彙オブジェクト検出: このトラックはさらに一歩進んで、未知のオブジェクトを含むオープンなカテゴリのセットからオブジェクトを検出するアルゴリズムを必要とします。
次のセクションでは、参加者から提出されたソリューションの包括的な概要と分析を提供します。
提示された方法とソリューションを分析することで、膨大な語彙とオープン語彙のオブジェクト検出に関する将来の研究の方向性を刺激し、この分野の進歩を促進することを目指しています。
チャレンジのホームページ: https://v3det.openxlab.org.cn/challenge

要約(オリジナル)

Detecting objects in real-world scenes is a complex task due to various challenges, including the vast range of object categories, and potential encounters with previously unknown or unseen objects. The challenges necessitate the development of public benchmarks and challenges to advance the field of object detection. Inspired by the success of previous COCO and LVIS Challenges, we organize the V3Det Challenge 2024 in conjunction with the 4th Open World Vision Workshop: Visual Perception via Learning in an Open World (VPLOW) at CVPR 2024, Seattle, US. This challenge aims to push the boundaries of object detection research and encourage innovation in this field. The V3Det Challenge 2024 consists of two tracks: 1) Vast Vocabulary Object Detection: This track focuses on detecting objects from a large set of 13204 categories, testing the detection algorithm’s ability to recognize and locate diverse objects. 2) Open Vocabulary Object Detection: This track goes a step further, requiring algorithms to detect objects from an open set of categories, including unknown objects. In the following sections, we will provide a comprehensive summary and analysis of the solutions submitted by participants. By analyzing the methods and solutions presented, we aim to inspire future research directions in vast vocabulary and open-vocabulary object detection, driving progress in this field. Challenge homepage: https://v3det.openxlab.org.cn/challenge

arxiv情報

著者 Jiaqi Wang,Yuhang Zang,Pan Zhang,Tao Chu,Yuhang Cao,Zeyi Sun,Ziyu Liu,Xiaoyi Dong,Tong Wu,Dahua Lin,Zeming Chen,Zhi Wang,Lingchen Meng,Wenhao Yao,Jianwei Yang,Sihong Wu,Zhineng Chen,Zuxuan Wu,Yu-Gang Jiang,Peixi Wu,Bosong Chai,Xuan Nie,Longquan Yan,Zeyu Wang,Qifan Zhou,Boning Wang,Jiaqi Huang,Zunnan Xu,Xiu Li,Kehong Yuan,Yanyan Zu,Jiayao Ha,Qiong Gao,Licheng Jiao
発行日 2024-06-17 16:58:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク