Natural Language Processing in the Patent Domain: A Survey

要約

テキスト形式の重要な技術的および法的情報をカプセル化し、図面を参照する特許は、自然言語処理(NLP)アプリケーションの豊富なドメインを提示します。
NLPテクノロジーが進化するにつれて、大規模な言語モデル(LLMS)は、一般的なテキスト処理および生成タスクで優れた機能を実証しています。
ただし、特許領域でのLLMの適用は、特に言語と法的枠組みの複雑さのために、特許ドメインの複雑さのために不足しておらず、未開発のままです。
特許文書のユニークな特性と特許領域での関連研究を理解することは、研究者がこれらのツールを効果的に適用するために不可欠です。
したがって、このペーパーは、この複雑なドメインを効率的にナビゲートするための重要な知識をNLP研究者に装備することを目的としています。
強固な背景情報を提供するために、特許の関連する基本的な側面を紹介します。
さらに、特許に固有の構造的および言語特性を体系的に分解し、NLPを特許分析と生成にどのように活用できるかをマップします。
さらに、9つの特許分析と4つの特許生成タスクを含む、テキストベースおよびマルチモーダル特許関連のタスクのスペクトルを実証します。

要約(オリジナル)

Patents, which encapsulate crucial technical and legal information in text form and referenced drawings, present a rich domain for natural language processing (NLP) applications. As NLP technologies evolve, large language models (LLMs) have demonstrated outstanding capabilities in general text processing and generation tasks. However, the application of LLMs in the patent domain remains under-explored and under-developed due to the complexity of patents, particularly their language and legal framework. Understanding the unique characteristics of patent documents and related research in the patent domain becomes essential for researchers to apply these tools effectively. Therefore, this paper aims to equip NLP researchers with the essential knowledge to navigate this complex domain efficiently. We introduce the relevant fundamental aspects of patents to provide solid background information. In addition, we systematically break down the structural and linguistic characteristics unique to patents and map out how NLP can be leveraged for patent analysis and generation. Moreover, we demonstrate the spectrum of text-based and multimodal patent-related tasks, including nine patent analysis and four patent generation tasks.

arxiv情報

著者 Lekang Jiang,Stephan Goetz
発行日 2025-04-23 16:48:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク