要約
現実世界の多くのプロパティは直接観察できないため、学習が困難です。
この困難な問題に対処するために、これまでの研究では主に、トレーニングのターゲット ラベルとして人間の採点されたスコアを使用して、これらの特性を推定することに焦点を当ててきました。
一方、ブラッドリー・テリーモデルに基づく評価アルゴリズムは、試合履歴に基づいて選手の競争力を評価するために広く研究されています。
この論文では、未知の項目の特性を定量化して評価するために設計された新しい機械学習フレームワークである Deep Bradley-Terry Rating (DBTR) を紹介します。
私たちの方法は、Bradley-Terry モデルをニューラル ネットワーク構造にシームレスに統合します。
さらに、このアーキテクチャを、現実世界の設定でより一般的に遭遇する条件である不公平性のある非対称環境にさらに一般化します。
実験分析を通じて、DBTR が望ましい特性を定量化および推定する方法を首尾よく学習することを実証します。
要約(オリジナル)
Many properties in the real world can’t be directly observed, making them difficult to learn. To deal with this challenging problem, prior works have primarily focused on estimating those properties by using graded human scores as the target label in the training. Meanwhile, rating algorithms based on the Bradley-Terry model are extensively studied to evaluate the competitiveness of players based on their match history. In this paper, we introduce the Deep Bradley-Terry Rating (DBTR), a novel machine learning framework designed to quantify and evaluate properties of unknown items. Our method seamlessly integrates the Bradley-Terry model into the neural network structure. Moreover, we generalize this architecture further to asymmetric environments with unfairness, a condition more commonly encountered in real-world settings. Through experimental analysis, we demonstrate that DBTR successfully learns to quantify and estimate desired properties.
arxiv情報
著者 | Satoru Fujii |
発行日 | 2023-08-15 10:55:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google