Redefining Toxicity: An Objective and Context-Aware Approach for Stress-Level-Based Detection

要約

毒性検出の基本的な問題は、「毒性」という用語が不明確であるという事実にあります。
このような不確実性により、研究者はモデルトレーニング中に主観的であいまいなデータに依存します。これは、「ごみのガベージアウト」パラダイムに続いて、非積極的で不正確な結果につながります。
この研究では、毒性検出のための新しい、客観的、およびコンテキスト対応のフレームワークを紹介し、毒性の重要な決定要因としてストレスレベルを活用します。
フレームワークの一部として、新しい定義、メトリック、トレーニングアプローチを提案し、収集したデータセットを使用して有効性を実証します。

要約(オリジナル)

The fundamental problem of toxicity detection lies in the fact that the term ‘toxicity’ is ill-defined. Such uncertainty causes researchers to rely on subjective and vague data during model training, which leads to non-robust and inaccurate results, following the ‘garbage in – garbage out’ paradigm. This study introduces a novel, objective, and context-aware framework for toxicity detection, leveraging stress levels as a key determinant of toxicity. We propose new definition, metric and training approach as a parts of our framework and demonstrate it’s effectiveness using a dataset we collected.

arxiv情報

著者 Sergey Berezin,Reza Farahbakhsh,Noel Crespi
発行日 2025-03-20 12:09:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク