Dataset Generation and Bonobo Classification from Weakly Labelled Videos

要約

この論文では、一般的に使用されている機械学習手法から構築されたボノボの検出および分類パイプラインを紹介します。
このような応用は、人間の助けを借りずにタッチスクリーンデバイスを使用して、檻の中でボノボをテストする必要性によって動機付けられています。
この研究では、半自動的に生成されたボノボの記録に基づいて新たに取得されたデータセットが導入されています。
ビデオ内に存在する個体を空間的に検出するために、録画には弱くラベルが付けられ、マカク検出器に供給されます。
ResNet アーキテクチャを使用したさまざまな分類アルゴリズムとディープラーニング手法を組み合わせた手作りの特徴が、ボノボの識別のために研究されています。
パフォーマンスは、さまざまなデータ分離方法を使用したデータベースの分割における分類精度の観点から比較されます。
データ準備の重要性と、間違ったデータ分離が誤った良好な結果につながる可能性があることを示します。
最後に、意味のあるデータの分離後、微調整された ResNet モデルを使用して最高の分類パフォーマンスが得られ、精度は 75% に達します。

要約(オリジナル)

This paper presents a bonobo detection and classification pipeline built from the commonly used machine learning methods. Such application is motivated by the need to test bonobos in their enclosure using touch screen devices without human assistance. This work introduces a newly acquired dataset based on bonobo recordings generated semi-automatically. The recordings are weakly labelled and fed to a macaque detector in order to spatially detect the individual present in the video. Handcrafted features coupled with different classification algorithms and deep-learning methods using a ResNet architecture are investigated for bonobo identification. Performance is compared in terms of classification accuracy on the splits of the database using different data separation methods. We demonstrate the importance of data preparation and how a wrong data separation can lead to false good results. Finally, after a meaningful separation of the data, the best classification performance is obtained using a fine-tuned ResNet model and reaches 75% of accuracy.

arxiv情報

著者 Pierre-Etienne Martin
発行日 2023-09-07 12:19:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク