要約
データ シリーズからの自然言語テキストの生成は、AI 研究目標の中で新たな関心を集めています。
当然のことですが、最新技術のいくつかの提案は、入力として提供されたデータを説明し、それと一貫性のあるテキストを生成するために、何らかのシステムをトレーニングすることに基づいています。
このようなアプローチの主な課題は、「何を」言うべきか (データ内で扱われる重要な説明要素) と「どのように」言うべきかを適切に特定することです。つまり、データとテキストの対応と正確さ、データ内の矛盾/冗長性の存在です。
テキスト、合成量のコントロール。
このペーパーでは、xAI 要件に準拠するフレームワークを紹介します。
特に、実証済みの最適なソリューションを使用して、精度誤差と合成量の明示的な制御を可能にする ASP/Python プログラムをモデル化します。
テキストの説明はトップダウン構造で階層的に編成されており、論理ルールに従ってテキストがさらに詳細に強化されます。
自然言語記述の構造の生成も論理ルールによって管理されます。
要約(オリジナル)
The generation of natural language text from data series gained renewed interest among AI research goals. Not surprisingly, the few proposals in the state of the art are based on training some system, in order to produce a text that describes and that is coherent to the data provided as input. Main challenges of such approaches are the proper identification of ‘what’ to say (the key descriptive elements to be addressed in the data) and ‘how’ to say: the correspondence and accuracy between data and text, the presence of contradictions/redundancy in the text, the control of the amount of synthesis. This paper presents a framework that is compliant with xAI requirements. In particular we model ASP/Python programs that enable an explicit control of accuracy errors and amount of synthesis, with proven optimal solutions. The text description is hierarchically organized, in a top-down structure where text is enriched with further details, according to logic rules. The generation of natural language descriptions’ structure is also managed by logic rules.
arxiv情報
著者 | Alessandro Dal Palù,Agostino Dovier,Andrea Formisano |
発行日 | 2023-08-30 09:09:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google