Document Navigability: A Need for Print-Impaired

要約

印刷されたドキュメントは、視覚障害者、低視力、およびその他の印刷障害者(BLV)にとって引き続き課題となっています。
この論文では、引用、脚注、図、表、方程式への内部参照の(非)アクセシビリティの特定の問題に焦点を当てます。
目の見えるユーザーは参照されたコンテンツに戻って数秒で元に戻すことができますが、BLVの個人が依存する線形音声ナレーションは、これらの参照に従うことを非常に困難にします。
参照されたコンテンツを見つけ、(後続の作業で)コンテンツの要約を音声ナレーションにインライン化するために必要なメタデータを抽出するためのビジョンベースの手法を提案します。
私たちは、科学文書の引用に私たちの技術を適用し、それが生まれたデジタル文書とスキャンされた文書の両方でうまく機能することを発見しました。

要約(オリジナル)

Printed documents continue to be a challenge for blind, low-vision, and other print-disabled (BLV) individuals. In this paper, we focus on the specific problem of (in-)accessibility of internal references to citations, footnotes, figures, tables and equations. While sighted users can flip to the referenced content and flip back in seconds, linear audio narration that BLV individuals rely on makes following these references extremely hard. We propose a vision based technique to locate the referenced content and extract metadata needed to (in subsequent work) inline a content summary into the audio narration. We apply our technique to citations in scientific documents and find it works well both on born-digital as well as scanned documents.

arxiv情報

著者 Anukriti Kumar,Tanuja Ganu,Saikat Guha
発行日 2022-06-21 11:01:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC パーマリンク