Should ChatGPT and Bard Share Revenue with Their Data Providers? A New Business Model for the AI Era

要約

タイトル:
ChatGPTとBardはデータ提供者と収益を共有すべきか?AI時代の新しいビジネスモデル

要約:
– AIツールの人気が高まり、真のAI時代に突入している。
– 優れたAIツールが収益を上げることが予想される。
– 重要な質問が生じる:AIツールは、従来の関係者および株主に加えて、トレーニングデータ提供者と収益を共有するべきか?
– 回答はイエス。
– 大規模な言語モデルなどの大きなAIツールは、常に改善するためにより多くの高品質のデータが必要であるが、著作権法によってさまざまな種類のデータへのアクセスが制限されている。
– AIツールとデータ提供者の間の収益の共有は、AIツールと著作権保有者の大多数との敵対的なゼロサムゲーム関係を共同の利益を追求する協力的で相互に有益な関係に変え、AI技術を前進させ、健全なAIエコシステムを構築するために必要となる良き循環を促進するために重要である。
– ただし、AIツールにとって最も広く使用されているウェブサイトベースのトラフィックおよびアクションの測定指標(クリックなど)は、プロンプトおよびプロンプトごとのコストなどの新しい指標に置き換わるため、AI時代に入るにあたり、既存の収益共有ビジネスモデルは機能しない。
– 新しい収益共有ビジネスモデルは、AIツールにほぼ独立しており、データ提供者に簡単に説明できるプロンプトベースのスコアリングシステムを確立する必要がある。
– 本稿では、分類とコンテンツの類似性モデルに基づいて、AIツールのすべてのデータ提供者のためにこのようなスコアリングシステムを構築する方法について系統的に説明し、AIツールまたは第三者に必要な要件を概説する。
– このようなスコアリングシステムを使用してデータ提供者と収益を共有することで、より多くのデータ所有者が収益共有プログラムに参加するようになる。これは、全ての関係者が利益を得る功利的なAI時代となるであろう。

要約(オリジナル)

With various AI tools such as ChatGPT becoming increasingly popular, we are entering a true AI era. We can foresee that exceptional AI tools will soon reap considerable profits. A crucial question arise: should AI tools share revenue with their training data providers in additional to traditional stakeholders and shareholders? The answer is Yes. Large AI tools, such as large language models, always require more and better quality data to continuously improve, but current copyright laws limit their access to various types of data. Sharing revenue between AI tools and their data providers could transform the current hostile zero-sum game relationship between AI tools and a majority of copyrighted data owners into a collaborative and mutually beneficial one, which is necessary to facilitate the development of a virtuous cycle among AI tools, their users and data providers that drives forward AI technology and builds a healthy AI ecosystem. However, current revenue-sharing business models do not work for AI tools in the forthcoming AI era, since the most widely used metrics for website-based traffic and action, such as clicks, will be replaced by new metrics such as prompts and cost per prompt for generative AI tools. A completely new revenue-sharing business model, which must be almost independent of AI tools and be easily explained to data providers, needs to establish a prompt-based scoring system to measure data engagement of each data provider. This paper systematically discusses how to build such a scoring system for all data providers for AI tools based on classification and content similarity models, and outlines the requirements for AI tools or third parties to build it. Sharing revenue with data providers using such a scoring system would encourage more data owners to participate in the revenue-sharing program. This will be a utilitarian AI era where all parties benefit.

arxiv情報

著者 Dong Zhang
発行日 2023-05-04 05:21:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG パーマリンク