Panmodal Information Interaction

要約

生成人工知能 (GenAI) の出現により、情報の相互作用が変化しています。
何十年もの間、Google や Bing などの検索エンジンは、一般の人々にとって関連情報を見つけるための主な手段でした。
彼らは、同じ標準形式 (いわゆる「10 の青いリンク」) で検索結果を提供しています。
AI ベースのエージェントと自然言語を介してチャットし、GenAI がリアルタイムで回答を自動的に合成する (上位ランクの結果に基づいて) 最近の機能により、人々が情報とやり取りし、情報を消費する方法が大規模に変化しています。
これら 2 つの情報対話形式 (従来の検索と AI を活用したチャット) は、疎結合 (例: 個別のオプション/タブとして) または密結合 (例: 従来の検索結果内に直接埋め込まれたチャット回答として統合) のいずれかで、現在の検索エンジンに共存しています。
ページ)。
これら 2 つの異なるモダリティ、そして潜在的に他の多くのモダリティの存在が、検索エクスペリエンスを再考し、多くのモダリティの強みを活用し、それらの間のシームレスなフローをサポートするシステムと戦略を開発する機会を生み出していると私たちは信じています。
私たちはこれらをパンモーダル体験と呼んでいます。
目の前のタスクに 1 つのモダリティのみが利用可能および/または使用されるモノモーダル エクスペリエンスとは異なり、パンモーダル エクスペリエンスでは、ユーザーが複数のモダリティを利用できるようになり (マルチモーダル)、モダリティ間の移行を直接サポートし (クロスモーダル)、モダリティをシームレスに組み合わせてタスク支援を調整します (
トランスモーダル)。
私たちは検索と​​チャットに焦点を当てていますが、これら 2 つのモダリティで最近共通のタスクを実行した 100 人以上の個人を対象とした調査から得た洞察から得た知見をもとに、複数のモダリティと新しい機能を使用した情報対話の将来についてのより一般的なビジョンも示しています。
GenAIの。

要約(オリジナル)

The emergence of generative artificial intelligence (GenAI) is transforming information interaction. For decades, search engines such as Google and Bing have been the primary means of locating relevant information for the general population. They have provided search results in the same standard format (the so-called ’10 blue links’). The recent ability to chat via natural language with AI-based agents and have GenAI automatically synthesize answers in real-time (grounded in top-ranked results) is changing how people interact with and consume information at massive scale. These two information interaction modalities (traditional search and AI-powered chat) coexist in current search engines, either loosely coupled (e.g., as separate options/tabs) or tightly coupled (e.g., integrated as a chat answer embedded directly within a traditional search result page). We believe that the existence of these two different modalities, and potentially many others, is creating an opportunity to re-imagine the search experience, capitalize on the strengths of many modalities, and develop systems and strategies to support seamless flow between them. We refer to these as panmodal experiences. Unlike monomodal experiences, where only one modality is available and/or used for the task at hand, panmodal experiences make multiple modalities available to users (multimodal), directly support transitions between modalities (crossmodal), and seamlessly combine modalities to tailor task assistance (transmodal). While our focus is search and chat, with learnings from insights from a survey of over 100 individuals who have recently performed common tasks on these two modalities, we also present a more general vision for the future of information interaction using multiple modalities and the emergent capabilities of GenAI.

arxiv情報

著者 Chirag Shah,Ryen W. White
発行日 2024-05-21 16:49:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.IR パーマリンク