要約
人間と同じように言語を習得することを目的としたインテリジェントシステムは、言語の意味上の過小仕様、つまり、言語信号がコミュニケーションの成功に必要な情報の一部しか伝えられない可能性があるという問題に対処しなければなりません。
代名詞theyの用法を考慮してください。これにより、その指示対象の性別と数が不明確になる可能性があります。
セマンティックな過小仕様はバグではなく、ストレージと処理の効率を高める重要な言語機能です。
実際、人間の話者は、意味的に不明確な言語信号を、多様な文脈、社会的または文化的慣習、共有知識などの広範な非言語情報と迅速かつ容易に統合できます。
標準的な NLP モデルでは、原則として、そのような追加情報へのアクセスがまったくないか、制限されていますが、視覚などの他のモダリティに言語をグラウンディングするマルチモーダル システムには、この現象を説明する機能が自然に備わっています。
ただし、パフォーマンスに悪影響を及ぼし、アプリケーションに使用すると有害な結果につながる可能性があるため、彼らはそれに苦労していることを示しています。
この意見書では、私たちのコミュニティが人間のユーザーとうまく対話できる言語技術の開発を目指すのであれば、意味論的な過小仕様を認識すべきであると主張します。
使いこなすことが重要ないくつかのアプリケーションについて説明し、この目標を達成するためのいくつかの方向性を概説します。
要約(オリジナル)
Intelligent systems that aim at mastering language as humans do must deal with its semantic underspecification, namely, the possibility for a linguistic signal to convey only part of the information needed for communication to succeed. Consider the usages of the pronoun they, which can leave the gender and number of its referent(s) underspecified. Semantic underspecification is not a bug but a crucial language feature that boosts its storage and processing efficiency. Indeed, human speakers can quickly and effortlessly integrate semantically-underspecified linguistic signals with a wide range of non-linguistic information, e.g., the multimodal context, social or cultural conventions, and shared knowledge. Standard NLP models have, in principle, no or limited access to such extra information, while multimodal systems grounding language into other modalities, such as vision, are naturally equipped to account for this phenomenon. However, we show that they struggle with it, which could negatively affect their performance and lead to harmful consequences when used for applications. In this position paper, we argue that our community should be aware of semantic underspecification if it aims to develop language technology that can successfully interact with human users. We discuss some applications where mastering it is crucial and outline a few directions toward achieving this goal.
arxiv情報
著者 | Sandro Pezzelle |
発行日 | 2023-06-08 14:39:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google