The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community

要約

人間モデルとの会話は、ユーザーの現実世界のシナリオ、行動、ニーズを知るための窓を提供するため、モデルの開発と研究にとって貴重なリソースとなります。
営利企業はモデルの API を通じてユーザー データを収集し、それを社内で使用して独自のモデルを改善していますが、オープンソースと研究コミュニティは遅れをとっています。
大規模な言語モデルを使用した人間の会話の統合セットである ShareLM コレクションと、それに付随するプラグイン (ユーザー モデルの会話を自発的に提供するための Web 拡張機能) を紹介します。
チャットを共有するプラットフォームがほとんどない場合、ShareLM プラグインによってこの機能が追加されるため、ユーザーはほとんどのプラットフォームから会話を共有できるようになります。
このプラグインを使用すると、ユーザーは会話レベルと応答レベルの両方で会話を評価し、非公開にしたい会話をユーザーのローカル ストレージから離れる前に削除できます。
私たちはプラグインの会話を ShareLM コレクションの一部としてリリースし、オープン ヒューマン モデル データの分野でのコミュニティのさらなる取り組みを呼びかけています。
コード、プラグイン、データが利用可能です。

要約(オリジナル)

Human-model conversations provide a window into users’ real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user’s local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.

arxiv情報

著者 Shachar Don-Yehiya,Leshem Choshen,Omri Abend
発行日 2024-08-15 17:46:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク