Category Query Learning for Human-Object Interaction Classification


より良い人間オブジェクトの特徴を学習することに焦点を当てた以前のほとんどの HOI メソッドとは異なり、カテゴリクエリ学習と呼ばれる斬新で補完的なアプローチを提案します。
このようなクエリは、インタラクション カテゴリに明示的に関連付けられ、トランスフォーマー デコーダーを介して画像固有のカテゴリ表現に変換され、補助的な画像レベルの分類タスクを介して学習されます。
3 つの代表的な HOI ベースラインで検証され、2 つのベンチマークで最先端の結果を達成しています。


Unlike most previous HOI methods that focus on learning better human-object features, we propose a novel and complementary approach called category query learning. Such queries are explicitly associated to interaction categories, converted to image specific category representation via a transformer decoder, and learnt via an auxiliary image-level classification task. This idea is motivated by an earlier multi-label image classification method, but is for the first time applied for the challenging human-object interaction classification task. Our method is simple, general and effective. It is validated on three representative HOI baselines and achieves new state-of-the-art results on two benchmarks.


著者 Chi Xie,Fangao Zeng,Yue Hu,Shuang Liang,Yichen Wei
発行日 2023-03-24 13:59:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク