Variational Quantum Classifiers for Natural-Language Text

要約

量子自然言語処理(QNLP)の研究の一環として、文の意味のDisCoCatモデルに基づいて、変分量子文分類器(VQSC)がlambeq / DisCoPyに実装・サポートされました。本稿では、VQSCについて、カテゴリ理論、文を文字列図としてモデル化するDisCoCat、文字列図をパラメータ化された量子回路として符号化するDisCoPyを含めて詳しく説明する。しかし、多くの自然言語処理タスクでは、複数の文からなるテキストを扱う必要があるが、lambeq / DisCoPyではサポートされていない。例えば、顧客からのフィードバックや製品レビューの感情分類がその例である。我々は、VQSCsに沿った変分量子テキスト分類器(VQTC)の3つの可能なアプローチについて議論する。1つ目は、タスクに応じた文の重み付けを行い、テキストを独立した文のグループとして扱う重み付き文の袋(Bag of Sentences)アプローチである。もう1つは、共参照解決アプローチで、テキストをその構成文の連結として扱い、それらの間の共参照を解決するものである。両アプローチはDisCoCatモデルに基づいており、lambeq / DisCoCatで実装可能である。一方、第3のアプローチは、単語と文の意味からテキストの意味を構成する際に、文の順序と単語の相互作用の両方を考慮するDisCoCircモデルに基づくものである。DisCoCircは、DisCoCatではすべての意味が静的であるのに対し、DisCoCircでは文が単語の意味を更新するため、DisCoCatを根本的に修正する。DisCoCircがDisCoCatを壊さずにlambeq / DisCoCatで実装できるかどうかは不明である。

要約(オリジナル)

As part of the recent research effort on quantum natural language processing (QNLP), variational quantum sentence classifiers (VQSCs) have been implemented and supported in lambeq / DisCoPy, based on the DisCoCat model of sentence meaning. We discuss in some detail VQSCs, including category theory, DisCoCat for modeling sentence as string diagram, and DisCoPy for encoding string diagram as parameterized quantum circuit. Many NLP tasks, however, require the handling of text consisting of multiple sentences, which is not supported in lambeq / DisCoPy. A good example is sentiment classification of customer feedback or product review. We discuss three potential approaches to variational quantum text classifiers (VQTCs), in line with VQSCs. The first is a weighted bag-of-sentences approach which treats text as a group of independent sentences with task-specific sentence weighting. The second is a coreference resolution approach which treats text as a consolidation of its member sentences with coreferences among them resolved. Both approaches are based on the DisCoCat model and should be implementable in lambeq / DisCoCat. The third approach, on the other hand, is based on the DisCoCirc model which considers both ordering of sentences and interaction of words in composing text meaning from word and sentence meanings. DisCoCirc makes fundamental modification of DisCoCat since a sentence in DisCoCirc updates meanings of words, whereas all meanings are static in DisCoCat. It is not clear if DisCoCirc can be implemented in lambeq / DisCoCat without breaking DisCoCat.

arxiv情報

著者 Daniel T. Chang
発行日 2023-03-04 18:00:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.LG パーマリンク