要約
絵文字は、Web などの書面コミュニケーションで広く使われるようになりました。
感情を強調したり明確にしたり、会話に詳細を追加したり、単に装飾的な目的を果たしたりすることができます。
ただし、この何気ない使用法は、絵文字の表現力のほんの表面をなぞったに過ぎません。
この能力をさらに発揮するために、人間の入力を必要とせずに、任意のテキスト フレーズを 1 つ以上の絵文字のシーケンスに変換する方法である Emojiize を紹介します。
大規模な言語モデルの力を活用することで、Emojinize はコンテキスト (例: クリケットとバットの対コウモリ) に基づいて曖昧さを解消することで適切な絵文字を選択でき、複数の絵文字を組み合わせて複雑な概念を構成的に表現できます (例: 「Emojinize」は入力に翻訳されます)
-ラテン文字、右矢印、ニヤリとした顔)。
クローゼテストに基づいたユーザー調査では、Emojinize の絵文字翻訳ではマスクされた単語に対する人間の推測可能性が 55% 増加するのに対し、人間が選択した絵文字翻訳では 29% しか増加しないことが示されました。
これらの結果は、絵文字がさまざまな単語を正確に翻訳するのに十分な豊富な語彙を提供することを示唆しています。
さらに、Emojinize の絵文字翻訳で単語やフレーズに注釈を付けることにより、読み方を学ぶ子供、外国語を学ぶ大人、学習障害を持つ人々のテキスト理解など、多数の下流アプリケーションへの扉が開かれます。
要約(オリジナル)
Emoji have become ubiquitous in written communication, on the Web and beyond. They can emphasize or clarify emotions, add details to conversations, or simply serve decorative purposes. This casual use, however, barely scratches the surface of the expressive power of emoji. To further unleash this power, we present Emojinize, a method for translating arbitrary text phrases into sequences of one or more emoji without requiring human input. By leveraging the power of large language models, Emojinize can choose appropriate emoji by disambiguating based on context (eg, cricket-bat vs bat) and can express complex concepts compositionally by combining multiple emoji (eq, ”Emojinize” is translated to input-latin-letters right-arrow grinning-face). In a cloze test–based user study, we show that Emojinize’s emoji translations increase the human guessability of masked words by 55%, whereas human-picked emoji translations do so by only 29%. These results suggest that emoji provide a sufficiently rich vocabulary to accurately translate a wide variety of words. Moreover, annotating words and phrases with Emojinize’s emoji translations opens the door to numerous downstream applications, including children learning how to read, adults learning foreign languages, and text understanding for people with learning disabilities.
arxiv情報
著者 | Lars Henning Klein,Roland Aydin,Robert West |
発行日 | 2024-03-06 17:06:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google