Structured prompt interrogation and recursive extraction of semantics (SPIRES): A method for populating knowledge bases using zero-shot learning

要約

タイトル: ゼロショット学習を用いた知識ベースの構築における構造化プロンプト尋問と再帰的意味抽出(Structured Prompt Interrogation and Recursive Extraction of Semantics (SPIRES))

要約:
– 知識ベースやオントロジーの作成は手間がかかる作業である。
– AI / NLPアプローチは、専門家のキュレーターがこれらの知識ベースを作成する際に支援することができるが、現在のアプローチは多くのトレーニングデータに依存しており、任意の複雑なネストされた知識スキーマを生成することはできない。
– ここでは、「構造化プロンプト尋問と再帰的意味抽出(SPIRES)」という知識抽出手法を提案する。
– SPIRESは、指定されたスキーマに準拠した情報を返す柔軟なプロンプトからゼロショット学習(ZSL)と汎用クエリ応答を実行する大規模言語モデル(LLM)の能力に依存する知識抽出手法である。
– 詳細なユーザー定義の知識スキーマと入力テキストが与えられた場合、SPIRESは、GPT-3 +に対するプロンプト尋問を再帰的に実行して、提供されたスキーマに一致する一連の応答を取得する。
– SPIRESは、当該要素との一致する識別子を提供するために既存のオントロジーや語彙を利用する。
– この手法は、食品レシピ、多種多様な細胞シグナル伝達経路、疾患治療、多段階の薬剤メカニズム、化学物質から疾患原因グラフの抽出など、さまざまな分野でのSPIRESの使用例を示す。
– 現在のSPIRESの正確性は、既存の関係抽出(RE)手法の中間範囲に相当するが、容易なカスタマイズ性、柔軟性、そして特に、任意のトレーニングデータがなくても新しいタスクを実行できる能力を持つ利点がある。
– この手法は、LLMsの言語解釈能力を活用して、知識ベースを組み立て、手動の知識キュレーションと取得を支援し、LLMs外部の公開データベースやオントロジーを用いた検証をサポートする一般的戦略を支援する。
– SPIRESは、オープンソースのOntoGPTパッケージの一部として入手可能である。: https://github.com/ monarch-initiative/ontogpt.

要約(オリジナル)

Creating knowledge bases and ontologies is a time consuming task that relies on a manual curation. AI/NLP approaches can assist expert curators in populating these knowledge bases, but current approaches rely on extensive training data, and are not able to populate arbitrary complex nested knowledge schemas. Here we present Structured Prompt Interrogation and Recursive Extraction of Semantics (SPIRES), a Knowledge Extraction approach that relies on the ability of Large Language Models (LLMs) to perform zero-shot learning (ZSL) and general-purpose query answering from flexible prompts and return information conforming to a specified schema. Given a detailed, user-defined knowledge schema and an input text, SPIRES recursively performs prompt interrogation against GPT-3+ to obtain a set of responses matching the provided schema. SPIRES uses existing ontologies and vocabularies to provide identifiers for all matched elements. We present examples of use of SPIRES in different domains, including extraction of food recipes, multi-species cellular signaling pathways, disease treatments, multi-step drug mechanisms, and chemical to disease causation graphs. Current SPIRES accuracy is comparable to the mid-range of existing Relation Extraction (RE) methods, but has the advantage of easy customization, flexibility, and, crucially, the ability to perform new tasks in the absence of any training data. This method supports a general strategy of leveraging the language interpreting capabilities of LLMs to assemble knowledge bases, assisting manual knowledge curation and acquisition while supporting validation with publicly-available databases and ontologies external to the LLM. SPIRES is available as part of the open source OntoGPT package: https://github.com/ monarch-initiative/ontogpt.

arxiv情報

著者 J. Harry Caufield,Harshad Hegde,Vincent Emonet,Nomi L. Harris,Marcin P. Joachimiak,Nicolas Matentzoglu,HyeongSik Kim,Sierra A. T. Moxon,Justin T. Reese,Melissa A. Haendel,Peter N. Robinson,Christopher J. Mungall
発行日 2023-04-05 19:07:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク