The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community


人間とモデルの会話は、ユーザーの実世界のシナリオ、行動、ニーズを知る窓を提供するため、モデル開発と研究のための貴重なリソースとなります。営利企業が自社モデルのAPIを通じてユーザーデータを収集し、それを社内で使用して自社モデルを改善する一方で、オープンソースや研究コミュニティは遅れをとっています。 我々は、大規模な言語モデルを持つ人間の会話の統一されたセットであるShareLMコレクションと、それに付随するプラグインを紹介する。ShareLMプラグインは、会話を共有するプラットフォームが少ない中で、この機能を追加することで、ユーザがほとんどのプラットフォームから会話を共有できるようにします。このプラグインにより、ユーザーは会話と応答の両方のレベルで自分の会話を評価し、非公開にしたい会話をユーザーのローカルストレージを離れる前に削除することができます。我々は、プラグインの会話をShareLMコレクションの一部として公開し、オープンなヒューマンモデルデータの分野におけるコミュニティのさらなる努力を呼びかける。 コード、プラグイン、データは利用可能です。


Human-model conversations provide a window into users’ real-world scenarios, behavior, and needs, and thus are a valuable resource for model development and research. While for-profit companies collect user data through the APIs of their models, using it internally to improve their own models, the open source and research community lags behind. We introduce the ShareLM collection, a unified set of human conversations with large language models, and its accompanying plugin, a Web extension for voluntarily contributing user-model conversations. Where few platforms share their chats, the ShareLM plugin adds this functionality, thus, allowing users to share conversations from most platforms. The plugin allows the user to rate their conversations, both at the conversation and the response levels, and delete conversations they prefer to keep private before they ever leave the user’s local storage. We release the plugin conversations as part of the ShareLM collection, and call for more community effort in the field of open human-model data. The code, plugin, and data are available.


著者 Shachar Don-Yehiya,Leshem Choshen,Omri Abend
発行日 2025-03-03 13:18:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CL パーマリンク