Hawkeye: A PyTorch-based Library for Fine-Grained Image Recognition with Deep Learning

要約

FGIR (Fine-Grained Image Recognition) は、コンピュータ ビジョンとマルチメディアにおける基本的かつ困難なタスクであり、知的経済と産業用インターネット アプリケーションで重要な役割を果たします。
しかし、FGIR のさまざまなパラダイムをカバーする統一されたオープンソース ソフトウェア ライブラリが存在しないことは、この分野の研究者や実務者にとって大きな課題となっています。
このギャップに対処するために、深層学習を備えた FGIR 用の PyTorch ベースのライブラリである Hawkeye を紹介します。
Hawkeye はモジュール式アーキテクチャで設計されており、高品質のコードと人間が判読できる構成を重視し、FGIR タスクの包括的なソリューションを提供します。
Hawkeye では、6 つの異なるパラダイムをカバーする 16 の最先端のきめ細かいメソッドを実装しており、ユーザーが FGIR のさまざまなアプローチを探索できるようにしています。
私たちの知る限り、Hawkeye は FGIR 専用の最初のオープンソース PyTorch ベースのライブラリです。
これは https://github.com/Hawkeye-FineGrained/Hawkeye/ で公開されており、研究者や実務者に FGIR 分野での研究開発を進めるための強力なツールを提供します。

要約(オリジナル)

Fine-Grained Image Recognition (FGIR) is a fundamental and challenging task in computer vision and multimedia that plays a crucial role in Intellectual Economy and Industrial Internet applications. However, the absence of a unified open-source software library covering various paradigms in FGIR poses a significant challenge for researchers and practitioners in the field. To address this gap, we present Hawkeye, a PyTorch-based library for FGIR with deep learning. Hawkeye is designed with a modular architecture, emphasizing high-quality code and human-readable configuration, providing a comprehensive solution for FGIR tasks. In Hawkeye, we have implemented 16 state-of-the-art fine-grained methods, covering 6 different paradigms, enabling users to explore various approaches for FGIR. To the best of our knowledge, Hawkeye represents the first open-source PyTorch-based library dedicated to FGIR. It is publicly available at https://github.com/Hawkeye-FineGrained/Hawkeye/, providing researchers and practitioners with a powerful tool to advance their research and development in the field of FGIR.

arxiv情報

著者 Jiabei He,Yang Shen,Xiu-Shen Wei,Ye Wu
発行日 2023-11-24 15:29:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク