要約
毒性検出の基本的な問題は、「毒性」という用語が不明確であるという事実にあります。
このような不確実性により、研究者はモデルトレーニング中に主観的であいまいなデータに依存します。これは、「ごみのガベージアウト」パラダイムに続いて、非積極的で不正確な結果につながります。
この研究では、毒性検出のための新しい、客観的、およびコンテキスト対応のフレームワークを紹介し、毒性の重要な決定要因としてストレスレベルを活用します。
フレームワークの一部として、新しい定義、メトリック、トレーニングアプローチを提案し、収集したデータセットを使用して有効性を実証します。
要約(オリジナル)
The fundamental problem of toxicity detection lies in the fact that the term ‘toxicity’ is ill-defined. Such uncertainty causes researchers to rely on subjective and vague data during model training, which leads to non-robust and inaccurate results, following the ‘garbage in – garbage out’ paradigm. This study introduces a novel, objective, and context-aware framework for toxicity detection, leveraging stress levels as a key determinant of toxicity. We propose new definition, metric and training approach as a parts of our framework and demonstrate it’s effectiveness using a dataset we collected.
arxiv情報
著者 | Sergey Berezin,Reza Farahbakhsh,Noel Crespi |
発行日 | 2025-03-20 12:09:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google