要約
話す能力を持つロボットを支えるための努力は、自然言語処理の最近の進歩、特に大規模な言語モデルの恩恵を受けています。
ただし、現在の言語モデルは完全に漸進的ではありません。その処理は本質的に単調であり、したがって、新しい観測に照らして解釈または出力を修正する能力がないためです。
この単調性は、人間とロボットの相互作用のための対話システムの開発に重要な意味を持っています。
この論文では、段階的に動作するインタラクティブシステムに関する文献をレビューします(つまり、単語レベルまたはその下で)。
私たちは、漸進的なシステムの必要性、音声認識や言語生成などの対話の重要な側面の調査増分モデリングを動機付けます。
主な焦点は、Dialogue Managerとして知られる決定を下すシステムの部分にあります。
インクリメンタルな対話管理に関する研究はほとんどなく、実用的なインクリメンタルダイアログ管理のためのいくつかの要件を提供し、大規模な言語モデルの時代に具体化されたロボットプラットフォームに対するインクリメンタルダイアログの意味を提供していることがわかります。
要約(オリジナル)
Efforts towards endowing robots with the ability to speak have benefited from recent advancements in natural language processing, in particular large language models. However, current language models are not fully incremental, as their processing is inherently monotonic and thus lack the ability to revise their interpretations or output in light of newer observations. This monotonicity has important implications for the development of dialogue systems for human–robot interaction. In this paper, we review the literature on interactive systems that operate incrementally (i.e., at the word level or below it). We motivate the need for incremental systems, survey incremental modeling of important aspects of dialogue like speech recognition and language generation. Primary focus is on the part of the system that makes decisions, known as the dialogue manager. We find that there is very little research on incremental dialogue management, offer some requirements for practical incremental dialogue management, and the implications of incremental dialogue for embodied, robotic platforms in the age of large language models.
arxiv情報
著者 | Casey Kennington,Pierre Lison,David Schlangen |
発行日 | 2025-04-02 14:24:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google