A transparent approach to data representation

要約

タイトル:データ表現への透明性に対するアプローチ
要約:
-Netflix視聴者が映画に対して評価したデータセットを説明するために、バイナリ属性表現(BAR)モデルを使用しています。
-連続的なパラメーターではなく、離散的ビットで視聴者を分類することで、表現がコンパクトで透明になります。
-属性は解釈が容易であり、同じエラーレベルを達成するために必要な属性数は、類似した方法に比べてはるかに少なくなります。
-データセット内の映画の評価の不均一な分布を利用して、他の映画のパフォーマンスを損なうことなく、少数の映画にトレーニングを行います。

要約(オリジナル)

We use a binary attribute representation (BAR) model to describe a data set of Netflix viewers’ ratings of movies. We classify the viewers with discrete bits rather than continuous parameters, which makes the representation compact and transparent. The attributes are easy to interpret, and we need far fewer attributes than similar methods do to achieve the same level of error. We also take advantage of the nonuniform distribution of ratings among the movies in the data set to train on a small selection of movies without compromising performance on the rest of the movies.

arxiv情報

著者 Sean Deyo,Veit Elser
発行日 2023-04-27 14:17:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG パーマリンク