The Semantic Reader Project: Augmenting Scholarly Documents through AI-Powered Interactive Reading Interfaces


タイトル:The Semantic Reader Project:AIによるインタラクティブな読み取りインターフェースを介した学術文書の拡張


– 学術出版物は学者から他の人々への知識の転送において重要である。
– 研究論文は情報密度が高く、科学文献の量が増えるにつれ、読書プロセスをサポートするための新しい技術の必要性が高まっている。
– 研究論文を見つけるプロセスがインターネットテクノロジーによって変革された一方で、研究論文を読む体験は数十年間ほとんど変わっていない。
– PDF形式は携帯性が高いため広く使用されているが、静的なコンテンツである、低視力の読者にとってはアクセシビリティが低い、モバイルデバイスでの読書が困難などの欠点がある。
– 本論文では、「AIとHCIの最近の進歩が、レガシーのPDFでも知的でインタラクティブでアクセス可能な読み取りインターフェースを実現できるか?」という問いに取り組む。Semantic Reader Projectという、複数の機関での共同プロジェクトを紹介する。
– 我々は、10個の研究プロトタイプの読み取りインターフェースを開発し、300人以上の参加者と実際のユーザーとのユーザビリティ研究を行い、学者にとって改善された読書経験を示した。
– 我々はまた、最高の機能を統合することができるようになったListener Reading Interface for Research Papersという製品型の読み取りインターフェースをリリースした。
– これらの進捗状況と残された課題を紹介するために、この論文は、学者と一般の人々が研究論文を読む際に直面する課題であるDiscovery、Efficiency、Comprehension、Synthesis、およびAccessibilityに沿って構成される。


Scholarly publications are key to the transfer of knowledge from scholars to others. However, research papers are information-dense, and as the volume of the scientific literature grows, the need for new technology to support the reading process grows. In contrast to the process of finding papers, which has been transformed by Internet technology, the experience of reading research papers has changed little in decades. The PDF format for sharing research papers is widely used due to its portability, but it has significant downsides including: static content, poor accessibility for low-vision readers, and difficulty reading on mobile devices. This paper explores the question ‘Can recent advances in AI and HCI power intelligent, interactive, and accessible reading interfaces — even for legacy PDFs?’ We describe the Semantic Reader Project, a collaborative effort across multiple institutions to explore automatic creation of dynamic reading interfaces for research papers. Through this project, we’ve developed ten research prototype interfaces and conducted usability studies with more than 300 participants and real-world users showing improved reading experiences for scholars. We’ve also released a production reading interface for research papers that will incorporate the best features as they mature. We structure this paper around challenges scholars and the public face when reading research papers — Discovery, Efficiency, Comprehension, Synthesis, and Accessibility — and present an overview of our progress and remaining open challenges.


著者 Kyle Lo,Joseph Chee Chang,Andrew Head,Jonathan Bragg,Amy X. Zhang,Cassidy Trier,Chloe Anastasiades,Tal August,Russell Authur,Danielle Bragg,Erin Bransom,Isabel Cachola,Stefan Candra,Yoganand Chandrasekhar,Yen-Sung Chen,Evie Yu-Yen Cheng,Yvonne Chou,Doug Downey,Rob Evans,Raymond Fok,Fangzhou Hu,Regan Huff,Dongyeop Kang,Tae Soo Kim,Rodney Kinney,Aniket Kittur,Hyeonsu Kang,Egor Klevak,Bailey Kuehl,Michael Langan,Matt Latzke,Jaron Lochner,Kelsey MacMillan,Eric Marsh,Tyler Murray,Aakanksha Naik,Ngoc-Uyen Nguyen,Srishti Palani,Soya Park,Caroline Paulic,Napol Rachatasumrit,Smita Rao,Paul Sayre,Zejiang Shen,Pao Siangliulue,Luca Soldaini,Huy Tran,Madeleine van Zuylen,Lucy Lu Wang,Christopher Wilhelm,Caroline Wu,Jiangjiang Yang,Angele Zamarron,Marti A. Hearst,Daniel S. Weld
発行日 2023-04-23 09:12:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.CL, cs.HC パーマリンク