要約
データ マイニングの民主化は、強力で使いやすい機械学習ライブラリのおかげで広く成功しています。
これらのライブラリは、教師あり学習に取り組むために特に調整されています。
しかし、実際には強力な監視信号はほとんどなく、実践者は弱い監視に頼らざるを得ません。
監視の弱点に加えて、データセットの変化は、機械学習モデルを現実世界に展開するときに発生する別の種類の現象です。
そのため、Biquality Learning は、明確にラベル付けされた代表的なサンプルで構成された小規模で信頼できるデータセットの利用可能性に依存することで、監視とデータセットのシフトの性質やレベルを仮定することなく、監視やデータセットのシフトの複数の弱点に対処できるアルゴリズムを設計するための機械学習フレームワークとして提案されています。
。
したがって、私たちは biquality-learn を提案します。Biquality Learning 用の Python ライブラリです。Biquality Learning 用の Python ライブラリです。Biquality Learning には、biquality データから機械学習モデルを学習するための直観的で一貫した API があり、実証済みのアルゴリズムがあり、誰にとってもアクセスしやすく、研究者が再現可能な方法で実験できるようになります。
双方向データ。
要約(オリジナル)
The democratization of Data Mining has been widely successful thanks in part to powerful and easy-to-use Machine Learning libraries. These libraries have been particularly tailored to tackle Supervised Learning. However, strong supervision signals are scarce in practice, and practitioners must resort to weak supervision. In addition to weaknesses of supervision, dataset shifts are another kind of phenomenon that occurs when deploying machine learning models in the real world. That is why Biquality Learning has been proposed as a machine learning framework to design algorithms capable of handling multiple weaknesses of supervision and dataset shifts without assumptions on their nature and level by relying on the availability of a small trusted dataset composed of cleanly labeled and representative samples. Thus we propose biquality-learn: a Python library for Biquality Learning with an intuitive and consistent API to learn machine learning models from biquality data, with well-proven algorithms, accessible and easy to use for everyone, and enabling researchers to experiment in a reproducible way on biquality data.
arxiv情報
著者 | Pierre Nodet,Vincent Lemaire,Alexis Bondu,Antoine Cornuéjols |
発行日 | 2023-08-18 16:01:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google