Microsoft Cloud-based Digitization Workflow with Rich Metadata Acquisition for Cultural Heritage Objects


ヤギェウォ大学におけるいくつかの文化遺産への取り組みに応えて、私たちはヤギェウォ大学図書館 (JL) と協力して新しいデジタル化ワークフローを開発しました。
このソリューションは、メタデータ取得インターフェイスとして MS Excel ファイル、検証用の Office Script、およびストレージ用の MS Sharepoint を備えた Microsoft 365 クラウドなど、アクセスしやすい技術ソリューションに基づいており、分野の専門家 (文献学者、歴史学者、科学者など) によるメタデータの取得を可能にします。
最終的な目標は、分析された所蔵品を説明し、一般的な知識ベースや他の文化遺​​産コレクションにリンクされたナレッジ グラフを作成することです。そのため、メタデータの高精度と外部ソースへの適切なリンクには細心の注意が払われます。
このワークフローは、いわゆる「ベルリン・コレクション」のデジタル化に焦点を当てた DiHeLib プロジェクトの 2 つのパイロットと、海外からのゲストを招いた 2 つのワークショップですでに評価されており、その改良と JL での正確さと使いやすさの確認が可能になりました。
提案されたワークフローは、特定の機関におけるデジタル化と基本的なメタデータ収集に関する既存のシステムやドメイン ガイドライン (例: ファイル タイプ、画質、Dublin Core/MARC-21 の使用) に干渉せず、リッチなデータを可能にするためにそれらを拡張します。
以前は不可能だったメタデータの収集は、すべての GLAM (ギャラリー、図書館、アーカイブ、博物館) にとって興味深いものになる可能性があると考えています。


In response to several cultural heritage initiatives at the Jagiellonian University, we have developed a new digitization workflow in collaboration with the Jagiellonian Library (JL). The solution is based on easy-to-access technological solutions — Microsoft 365 cloud with MS Excel files as metadata acquisition interfaces, Office Script for validation, and MS Sharepoint for storage — that allows metadata acquisition by domain experts (philologists, historians, philosophers, librarians, archivists, curators, etc.) regardless of their experience with information systems. The ultimate goal is to create a knowledge graph that describes the analyzed holdings, linked to general knowledge bases, as well as to other cultural heritage collections, so careful attention is paid to the high accuracy of metadata and proper links to external sources. The workflow has already been evaluated in two pilots in the DiHeLib project focused on digitizing the so-called ‘Berlin Collection’ and in two workshops with international guests, which allowed for its refinement and confirmation of its correctness and usability for JL. As the proposed workflow does not interfere with existing systems or domain guidelines regarding digitization and basic metadata collection in a given institution (e.g., file type, image quality, use of Dublin Core/MARC-21), but extends them in order to enable rich metadata collection, not previously possible, we believe that it could be of interest to all GLAMs (galleries, libraries, archives, and museums).


著者 Krzysztof Kutt,Jakub Gomułka,Luiz do Valle Miranda,Grzegorz J. Nalepa
発行日 2024-07-09 15:49:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.DL, cs.HC パーマリンク