要約
マルチタスク学習 (MTL) は、関連する補助タスクと共同学習することで、主要なタスクのパフォーマンスを向上させることを目的としています。
従来の MTL メソッドは、トレーニング中にタスクをランダムに選択します。
しかし、以前の研究と私たちの結果はどちらも、そのようなランダムなタスクの選択は役に立たない可能性があり、パフォーマンスに悪影響を与える可能性さえあることを示唆しています。
したがって、MTL でのタスクの選択と割り当てのための新しい戦略を検討する必要があります。
この論文は、マルチモーダル、マルチタスクの対話行為分類タスクを研究し、ガウス事前分布を使用した割引トンプソン サンプリング (TS) を使用した非定常マルチアーム バンディット (MAB) に基づいてタスクを選択および割り当てる方法を提案します。
私たちの実験結果は、異なるトレーニング段階では、異なるタスクの有用性が異なることを示しています。
私たちの提案した方法は、タスクの有用性を効果的に特定し、無駄なタスクや有害なタスクを積極的に回避し、トレーニング中にタスクの割り当てを実現できます。
私たちが提案した方法は、UAR と F1 の点で、p 値 < 0.05 のシングルタスクおよびマルチタスクのベースラインよりも大幅に優れています。
実験をさらに分析すると、データの不均衡の問題を伴うデータセットに対して、私たちの提案した方法の安定性が大幅に向上し、少数派クラスに対して一貫した適切なパフォーマンスを得ることができることがわかりました。
私たちが提案する手法は、現在の最先端のモデルよりも優れています。
要約(オリジナル)
Multi-task learning (MTL) aims to improve the performance of a primary task by jointly learning with related auxiliary tasks. Traditional MTL methods select tasks randomly during training. However, both previous studies and our results suggest that such a random selection of tasks may not be helpful, and can even be harmful to performance. Therefore, new strategies for task selection and assignment in MTL need to be explored. This paper studies the multi-modal, multi-task dialogue act classification task, and proposes a method for selecting and assigning tasks based on non-stationary multi-armed bandits (MAB) with discounted Thompson Sampling (TS) using Gaussian priors. Our experimental results show that in different training stages, different tasks have different utility. Our proposed method can effectively identify the task utility, actively avoid useless or harmful tasks, and realise the task assignment during training. Our proposed method is significantly superior in terms of UAR and F1 to the single-task and multi-task baselines with p-values < 0.05. Further analysis of experiments indicates that for the dataset with the data imbalance problem, our proposed method has significantly higher stability and can obtain consistent and decent performance for minority classes. Our proposed method is superior to the current state-of-the-art model.
arxiv情報
著者 | Xiangheng He,Junjie Chen,Björn W. Schuller |
発行日 | 2024-01-11 13:18:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google