TextANIMAR: Text-based 3D Animal Fine-Grained Retrieval

要約

3D オブジェクトの検索は重要ではありますが、やりがいのあるタスクであり、近年ますます注目を集めています。
既存のアプローチはこの問題への対処において進歩を遂げていますが、多くの場合、画像やスケッチのクエリなどの制限された設定に限定されており、一般ユーザーにとっては不親切な操作となることがよくあります。
これらの制限を克服するために、この論文では、3D 動物モデルのテキストベースのきめ細かい検索に焦点を当てた新しい SHREC チャレンジ トラックを紹介します。
これまでの SHREC チャレンジ トラックとは異なり、提案されたタスクはかなり難易度が高く、参加者はテキストベースの検索の問題に取り組むための革新的なアプローチを開発する必要があります。
難易度は高くなりますが、このタスクは潜在的に実用的なアプリケーションを推進し、3D オブジェクトとのより直観的な対話を促進できると考えています。
コンテストには 5 つのグループが参加し、合計 114 件のランを提出しました。
私たちの競争で得られた結果は満足のいくものですが、この課題によってもたらされる課題は完全には解決されていないことに注意してください。
そのため、私たちは将来の研究と改善の可能性のある領域についての洞察を提供します。
私たちは、ビジョン言語テクノロジーを通じて 3D オブジェクト検索の限界を押し広げ、よりユーザーフレンドリーなインタラクションを促進できると信じています。
https://aichallenge.hcmus.edu.vn/textanimar

要約(オリジナル)

3D object retrieval is an important yet challenging task that has drawn more and more attention in recent years. While existing approaches have made strides in addressing this issue, they are often limited to restricted settings such as image and sketch queries, which are often unfriendly interactions for common users. In order to overcome these limitations, this paper presents a novel SHREC challenge track focusing on text-based fine-grained retrieval of 3D animal models. Unlike previous SHREC challenge tracks, the proposed task is considerably more challenging, requiring participants to develop innovative approaches to tackle the problem of text-based retrieval. Despite the increased difficulty, we believe this task can potentially drive useful applications in practice and facilitate more intuitive interactions with 3D objects. Five groups participated in our competition, submitting a total of 114 runs. While the results obtained in our competition are satisfactory, we note that the challenges presented by this task are far from fully solved. As such, we provide insights into potential areas for future research and improvements. We believe we can help push the boundaries of 3D object retrieval and facilitate more user-friendly interactions via vision-language technologies. https://aichallenge.hcmus.edu.vn/textanimar

arxiv情報

著者 Trung-Nghia Le,Tam V. Nguyen,Minh-Quan Le,Trong-Thuan Nguyen,Viet-Tham Huynh,Trong-Le Do,Khanh-Duy Le,Mai-Khiem Tran,Nhat Hoang-Xuan,Thang-Long Nguyen-Ho,Vinh-Tiep Nguyen,Tuong-Nghiem Diep,Khanh-Duy Ho,Xuan-Hieu Nguyen,Thien-Phuc Tran,Tuan-Anh Yang,Kim-Phat Tran,Nhu-Vinh Hoang,Minh-Quang Nguyen,E-Ro Nguyen,Minh-Khoi Nguyen-Nhat,Tuan-An To,Trung-Truc Huynh-Le,Nham-Tan Nguyen,Hoang-Chau Luong,Truong Hoai Phong,Nhat-Quynh Le-Pham,Huu-Phuc Pham,Trong-Vu Hoang,Quang-Binh Nguyen,Hai-Dang Nguyen,Akihiro Sugimoto,Minh-Triet Tran
発行日 2023-08-09 16:57:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク