要約
最近、プロファイルベースの音声言語理解 (SLU) がますます注目を集めています。これは、さまざまな種類の補足プロファイル情報 (つまり、ナレッジ グラフ、ユーザー プロファイル、コンテキスト認識) を組み込んで、ユーザーの発話に蔓延するあいまいさを排除することを目的としています。
しかし、既存のアプローチでは、相互関係を考慮したり、プロファイル内の無関係で矛盾する情報を除外したりすることなく、異なるプロファイル情報を個別にモデル化することしかできません。
上記の問題に対処するために、Pro-HAN と呼ばれる、複数のプロファイル情報にわたって推論を実行する異種グラフ アテンション ネットワークを導入します。
具体的には、複数の Pro 間の相互関係を把握するために、Pro 内、Pro 間、および発話 Pro として示される 3 種類のエッジを設計します。
私たちは、ProSLU データセットに関する新しい最先端の技術を確立し、3 つの指標すべてで約 8% の改善を実現しました。
さらなる分析実験により、マルチソースプロファイル情報のモデル化における本手法の有効性も確認されています。
要約(オリジナル)
Recently, Profile-based Spoken Language Understanding (SLU) has gained increasing attention, which aims to incorporate various types of supplementary profile information (i.e., Knowledge Graph, User Profile, Context Awareness) to eliminate the prevalent ambiguities in user utterances. However, existing approaches can only separately model different profile information, without considering their interrelationships or excluding irrelevant and conflicting information within them. To address the above issues, we introduce a Heterogeneous Graph Attention Network to perform reasoning across multiple Profile information, called Pro-HAN. Specifically, we design three types of edges, denoted as intra-Pro, inter-Pro, and utterance-Pro, to capture interrelationships among multiple Pros. We establish a new state-of-the-art on the ProSLU dataset, with an improvement of approximately 8% across all three metrics. Further analysis experiments also confirm the effectiveness of our method in modeling multi-source profile information.
arxiv情報
著者 | Dechuan Teng,Chunlin Lu,Xiao Xu,Wanxiang Che,Libo Qin |
発行日 | 2024-02-06 11:12:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google