PatentEdits: Framing Patent Novelty as Textual Entailment

要約

米国特許庁 (USPTO) によって特許が付与されるためには、特許が新規かつ非自明であるとみなされる必要があります。
そうでない場合、米国特許審査官は、新規性を無効にする先行研究または先行技術を引用し、非最終拒絶を発行します。
従来技術を考慮して発明のどの請求項が変更されるべきかを予測することは、発明の権利を確保する上で不可欠かつ重要なステップですが、学習可能なタスクとしてはこれまで研究されていませんでした。
この研究では、新規性に対する反対意見を克服し、改訂に成功した 105,000 件の例が含まれる PatentEdits データセットを紹介します。
私たちは編集に文ごとにラベルを付けるアルゴリズムを設計し、大規模言語モデル (LLM) を使用してこれらの編集をどの程度正確に予測できるかを確立します。
我々は、引用文献と草案文の間のテキスト含意の評価が、従来技術との関連でどの発明の請求項が変更されていないのか、または新規であるかを予測するのに特に効果的であることを実証する。

要約(オリジナル)

A patent must be deemed novel and non-obvious in order to be granted by the US Patent Office (USPTO). If it is not, a US patent examiner will cite the prior work, or prior art, that invalidates the novelty and issue a non-final rejection. Predicting what claims of the invention should change given the prior art is an essential and crucial step in securing invention rights, yet has not been studied before as a learnable task. In this work we introduce the PatentEdits dataset, which contains 105K examples of successful revisions that overcome objections to novelty. We design algorithms to label edits sentence by sentence, then establish how well these edits can be predicted with large language models (LLMs). We demonstrate that evaluating textual entailment between cited references and draft sentences is especially effective in predicting which inventive claims remained unchanged or are novel in relation to prior art.

arxiv情報

著者 Ryan Lee,Alexander Spangher,Xuezhe Ma
発行日 2024-11-20 17:23:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CY, cs.IR パーマリンク