要約
生成無限ゲームの概念を紹介します。これは、生成モデルを使用することで、ハードコーディングされた有限システムの従来の境界を超えるビデオ ゲームです。
James P. Carse の有限ゲームと無限ゲームの区別にインスピレーションを受け、私たちは生成 AI の最近の進歩を活用して Unbounded を作成しました。Unbounded は、生成モデルに完全にカプセル化されたキャラクターのライフ シミュレーション ゲームです。
具体的には、Unbounded はサンドボックス ライフ シミュレーションからインスピレーションを得ており、LLM によって生成されるオープンエンドのメカニズム (そのうちのいくつかは創発的である可能性があります) を使用して、餌を与えたり、遊んだり、誘導したりすることで、仮想世界で自律した仮想キャラクターと対話できるようになります。
Unbounded を開発するために、LLM とビジュアル生成の両方の領域で技術革新を提案します。
具体的には、(1) ゲームの仕組み、物語、キャラクターの相互作用をリアルタイムで動的に生成する、特殊化された大規模言語モデル (LLM)、および (2) 新しい動的地域イメージ プロンプト アダプター (IP アダプター) を提示します。
複数の環境にわたって一貫性がありながら柔軟なキャラクターのビジュアル生成を保証するビジョン モデル用。
私たちは定性分析と定量分析の両方を通じてシステムを評価し、従来の関連アプローチと比較して、キャラクターのライフ シミュレーション、ユーザー指示のフォロー、物語の一貫性、キャラクターと環境の両方の視覚的一貫性が大幅に向上していることを示しています。
要約(オリジナル)
We introduce the concept of a generative infinite game, a video game that transcends the traditional boundaries of finite, hard-coded systems by using generative models. Inspired by James P. Carse’s distinction between finite and infinite games, we leverage recent advances in generative AI to create Unbounded: a game of character life simulation that is fully encapsulated in generative models. Specifically, Unbounded draws inspiration from sandbox life simulations and allows you to interact with your autonomous virtual character in a virtual world by feeding, playing with and guiding it – with open-ended mechanics generated by an LLM, some of which can be emergent. In order to develop Unbounded, we propose technical innovations in both the LLM and visual generation domains. Specifically, we present: (1) a specialized, distilled large language model (LLM) that dynamically generates game mechanics, narratives, and character interactions in real-time, and (2) a new dynamic regional image prompt Adapter (IP-Adapter) for vision models that ensures consistent yet flexible visual generation of a character across multiple environments. We evaluate our system through both qualitative and quantitative analysis, showing significant improvements in character life simulation, user instruction following, narrative coherence, and visual consistency for both characters and the environments compared to traditional related approaches.
arxiv情報
著者 | Jialu Li,Yuanzhen Li,Neal Wadhwa,Yael Pritch,David E. Jacobs,Michael Rubinstein,Mohit Bansal,Nataniel Ruiz |
発行日 | 2024-10-30 16:10:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google