Making History Readable

要約

バージニア工科大学図書館 (VTUL) デジタル ライブラリ プラットフォーム (DLP) は、歴史的および文化的に重要なさまざまな文書へのアクセスをユーザーに提供するデジタル コレクションをホストしています。
これらのコレクションは学術的に重要であるだけでなく、ユーザーに地元の歴史的出来事を一目で知ることもできます。
当社の DLP には、複雑なレイアウト、色褪せた画像、読みにくい手書きのテキストを特徴とするデジタル オブジェクトで構成されるコレクションが含まれているため、これらのマテリアルへのオンライン アクセスを提供することが困難になっています。
これらの問題に対処するために、私たちは AI を DLP ワークフローに統合し、デジタル オブジェクト内のテキストを機械可読形式に変換します。
歴史的コレクションのユーザー エクスペリエンスを向上させるために、手書き認識、テキスト抽出、要約用の大規模言語モデル (LLM) にカスタム AI エージェントを使用しています。
このポスターは、手書きの手紙、新聞、デジタル地形図に焦点を当てた 3 つのコレクションを紹介しています。
私たちは各コレクションの課題について話し合い、それらに対処するためのアプローチを詳しく説明します。
私たちが提案する方法は、これらのコレクション内のコンテンツの検索と移動を容易にすることで、ユーザー エクスペリエンスを向上させることを目的としています。

要約(オリジナル)

The Virginia Tech University Libraries (VTUL) Digital Library Platform (DLP) hosts digital collections that offer our users access to a wide variety of documents of historical and cultural importance. These collections are not only of academic importance but also provide our users with a glance at local historical events. Our DLP contains collections comprising digital objects featuring complex layouts, faded imagery, and hard-to-read handwritten text, which makes providing online access to these materials challenging. To address these issues, we integrate AI into our DLP workflow and convert the text in the digital objects into a machine-readable format. To enhance the user experience with our historical collections, we use custom AI agents for handwriting recognition, text extraction, and large language models (LLMs) for summarization. This poster highlights three collections focusing on handwritten letters, newspapers, and digitized topographic maps. We discuss the challenges with each collection and detail our approaches to address them. Our proposed methods aim to enhance the user experience by making the contents in these collections easier to search and navigate.

arxiv情報

著者 Bipasha Banerjee,Jennifer Goyne,William A. Ingram
発行日 2024-11-26 17:06:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DL, cs.IR パーマリンク