要約
効率的なオンデバイスモデルは、生態学的保全コミュニティにとって特に興味深い、ほぼセンサーの洞察生成にとって魅力的になりました。
このため、深い学習研究者は、より低い計算モデルを開発するためのより多くのアプローチを提案しています。
ただし、Vision TransformersはEdge Use Caseにとって非常に新しいため、入力データに基づいたサブネットワークの条件付きの実行はまだ未開拓のアプローチがあります。
この作業では、条件付き計算を使用して、地理的に認識された方法で構造化されたサブネットワークをバイアスする単一の種検出器のトレーニングを探ります。
場所ごとにエキスパートモデルを剪定する方法を提案し、2つの地理的に分散したデータセットの条件付き計算パフォーマンスを実証します:InaturalistとIwildcam。
要約(オリジナル)
Efficient on-device models have become attractive for near-sensor insight generation, of particular interest to the ecological conservation community. For this reason, deep learning researchers are proposing more approaches to develop lower compute models. However, since vision transformers are very new to the edge use case, there are still unexplored approaches, most notably conditional execution of subnetworks based on input data. In this work, we explore the training of a single species detector which uses conditional computation to bias structured sub networks in a geographically-aware manner. We propose a method for pruning the expert model per location and demonstrate conditional computation performance on two geographically distributed datasets: iNaturalist and iWildcam.
arxiv情報
著者 | Emmanuel Azuh Mensah,Joban Mand,Yueheng Ou,Min Jang,Kurtis Heimerl |
発行日 | 2025-04-11 15:25:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google