A Survey on Out-of-Distribution Detection in NLP

要約

タイトル:自然言語処理における外部分布検出に関する調査
要約:
– 外部分布(OOD)の検出は、機械学習システムを安全かつ信頼性高く実世界で展開するために必要不可欠である。
– 過去数年間で、OOD検出に関する大きな進展があった。
– 本論文は、最近のOOD検出の進展を、自然言語処理手法に特化して初めてまとめたものである。
– まず、OOD検出の正式な定義を提供し、関連分野について説明する。
– 次に、最近のアルゴリズムを、使用されるデータに応じて3つに分類する。(1) OODデータが利用可能な場合、 (2) OODデータが利用不可能でIDラベルを利用できる場合、(3) OODデータが利用不可能かつIDラベルも利用不可能な場合。
– さらに、データセット、アプリケーション、評価指標について紹介する。
– 最後に、既存の研究をまとめ、今後の研究トピックを提示する。

要約(オリジナル)

Out-of-distribution (OOD) detection is essential for the reliable and safe deployment of machine learning systems in the real world. Great progress has been made over the past years. This paper presents the first review of recent advances in OOD detection with a particular focus on natural language processing approaches. First, we provide a formal definition of OOD detection and discuss several related fields. We then categorize recent algorithms into three classes according to the data they used: (1) OOD data available, (2) OOD data unavailable + in-distribution (ID) label available, and (3) OOD data unavailable + ID label unavailable. Third, we introduce datasets, applications, and metrics. Finally, we summarize existing work and present potential future research topics.

arxiv情報

著者 Hao Lang,Yinhe Zheng,Yixuan Li,Jian Sun,Fei Huang,Yongbin Li
発行日 2023-05-05 01:38:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク