Solving Dialogue Grounding Embodied Task in a Simulated Environment using Further Masked Language Modeling

要約

人間の理解に合わせた効率的なコミュニケーション スキルを備えた AI システムを強化することは、人間のユーザーを効果的に支援するために不可欠です。
特定の状況を識別し、ユーザーと適切に対話してこれらのシナリオを解決するには、システム側からの積極的な取り組みが必要です。
この調査では、Minecraft データセットから取得した集合的な建物の割り当てを選択します。
私たちが提案する手法では、言語モデリングを採用し、言語モデルを使用した最先端 (SOTA) 手法を通じてタスクの理解を強化します。
これらのモデルは、マルチモーダルな理解の基礎とタスク指向の対話理解タスクに焦点を当てています。
この焦点は、これらのモデルがさまざまな入力やタスクをどのように解釈して応答するかについての洞察を得るのに役立ちます。
私たちの実験結果は、私たちが提案した方法の優位性を示す説得力のある証拠を提供します。
これは大幅な改善を示しており、この分野における将来の研究の有望な方向性を示しています。

要約(オリジナル)

Enhancing AI systems with efficient communication skills that align with human understanding is crucial for their effective assistance to human users. Proactive initiatives from the system side are needed to discern specific circumstances and interact aptly with users to solve these scenarios. In this research, we opt for a collective building assignment taken from the Minecraft dataset. Our proposed method employs language modeling to enhance task understanding through state-of-the-art (SOTA) methods using language models. These models focus on grounding multi-modal understandinging and task-oriented dialogue comprehension tasks. This focus aids in gaining insights into how well these models interpret and respond to a variety of inputs and tasks. Our experimental results provide compelling evidence of the superiority of our proposed method. This showcases a substantial improvement and points towards a promising direction for future research in this domain.

arxiv情報

著者 Weijie Jack Zhang
発行日 2023-06-21 17:17:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC パーマリンク