PokemonChat: Auditing ChatGPT for Pokémon Universe Knowledge

要約

最近リリースされた ChatGPT モデルは、ゼロショット質問応答において前例のない機能を実証しています。
この研究では、ChatGPT の会話理解について調査し、将来の研究で採用できる会話フレームワーク (プロトコル) を紹介します。
ポケモンの世界は、閉じられた世界を前提としているため、ChatGPT の推論能力を監査するための理想的な実験場として機能します。
ChatGPT の背景知識 (ポケモンの世界に関する) を明らかにした後、これらの概念を戦闘シナリオで使用するときの推論プロセスをテストします。
次に、新しい知識を獲得し、それを推論プロセスに組み込む能力を評価します。
私たちの最終的な目標は、ChatGPT の一般化、機能の組み合わせ、人間のフィードバックから新たに導入された知識を取得して推論する能力を評価することです。
ChatGPT にはポケモンの世界に関する事前知識があり、新しい情報が導入された場合でも、戦闘シナリオでかなりの程度まで推論できることがわかりました。
このモデルは、協力的なフィードバックがあり、情報取得の初期段階がある場合にパフォーマンスが向上しますが、時折幻覚が見られ、敵対的な攻撃を受けやすくなります。

要約(オリジナル)

The recently released ChatGPT model demonstrates unprecedented capabilities in zero-shot question-answering. In this work, we probe ChatGPT for its conversational understanding and introduce a conversational framework (protocol) that can be adopted in future studies. The Pok\’emon universe serves as an ideal testing ground for auditing ChatGPT’s reasoning capabilities due to its closed world assumption. After bringing ChatGPT’s background knowledge (on the Pok\’emon universe) to light, we test its reasoning process when using these concepts in battle scenarios. We then evaluate its ability to acquire new knowledge and include it in its reasoning process. Our ultimate goal is to assess ChatGPT’s ability to generalize, combine features, and to acquire and reason over newly introduced knowledge from human feedback. We find that ChatGPT has prior knowledge of the Pokemon universe, which can reason upon in battle scenarios to a great extent, even when new information is introduced. The model performs better with collaborative feedback and if there is an initial phase of information retrieval, but also hallucinates occasionally and is susceptible to adversarial attacks.

arxiv情報

著者 Laura Cabello,Jiaang Li,Ilias Chalkidis
発行日 2023-06-05 16:44:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク