Data Measurements for Decentralized Data Markets

要約

分散型データ市場は、機械学習のためのデータ取得をより公平な形で提供することができる。しかし、実用的なマーケットプレイスを実現するためには、売り手を選択するための効率的な技術を開発する必要がある。我々は、データの買い手が関連性のある多様なデータセットを持つ売り手を見つけることを可能にする、連携されたデータ測定を提案し、ベンチマークを行う。多様性と関連性の測定により、買い手は、中間ブローカーやタスク依存モデルのトレーニングを必要とせずに、売り手間の相対比較を行うことができる。

要約(オリジナル)

Decentralized data markets can provide more equitable forms of data acquisition for machine learning. However, to realize practical marketplaces, efficient techniques for seller selection need to be developed. We propose and benchmark federated data measurements to allow a data buyer to find sellers with relevant and diverse datasets. Diversity and relevance measures enable a buyer to make relative comparisons between sellers without requiring intermediate brokers and training task-dependent models.

arxiv情報

著者 Charles Lu,Mohammad Mohammadi Amiri,Ramesh Raskar
発行日 2024-06-06 17:03:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.IR, cs.LG パーマリンク