What A Situated Language-Using Agent Must be Able to Do: A Top-Down Analysis

要約

テキストがますます多用される時代においてさえ、言語使用の主な場所は位置付けられ、共存する相互作用です。
それは個体発生的にも系統発生的にも一次的なものであり、日常の社会的状況の交渉においても依然として一次的なものであることは間違いありません.
状況に応じたインタラクションは、自然言語処理の最後のフロンティアでもあります。テキスト処理の分野と比較して、過去 10 年間でほとんど進歩が見られず、無数の実用的なアプリケーションが解き放たれるのを待っています。
この分野での通常のアプローチは、ボトムアップで次の「隣接可能性」に到達することですが、この論文では、無制限の状況に応じた相互作用が参加エージェントに与える要求が何であるかについて、トップダウン分析を試みます。
この分析が計算モデルを構築し、それらに関する研究を行う方法を提案します。
具体的には、表象的要求 (世界モデル、言語モデル、状況モデル、談話モデル、およびエージェント モデルの構築と適用) と、私がアンカー プロセスと呼ぶもの (増分処理、増分学習、会話的グラウンディング、マルチモーダル グラウンディング) について説明します。
今、ここ、そして私たちへのエージェント。

要約(オリジナル)

Even in our increasingly text-intensive times, the primary site of language use is situated, co-present interaction. It is primary ontogenetically and phylogenetically, and it is arguably also still primary in negotiating everyday social situations. Situated interaction is also the final frontier of Natural Language Processing, where, compared to the area of text processing, very little progress has been made in the past decade, and where a myriad of practical applications is waiting to be unlocked. While the usual approach in the field is to reach, bottom-up, for the ever next ‘adjacent possible’, in this paper I attempt a top-down analysis of what the demands are that unrestricted situated interaction makes on the participating agent, and suggest ways in which this analysis can structure computational models and research on them. Specifically, I discuss representational demands (the building up and application of world model, language model, situation model, discourse model, and agent model) and what I call anchoring processes (incremental processing, incremental learning, conversational grounding, multimodal grounding) that bind the agent to the here, now, and us.

arxiv情報

著者 David Schlangen
発行日 2023-02-16 21:30:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク