Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging

要約

このホワイトペーパーでは、Semval-2025タスク5のシステムであるHOMAを紹介します。Tagking5:Subject Taggingは、Gemeinsame Normdatei(GND)分類法を使用してTibkatの技術記録にサブジェクトラベルを自動的に割り当てることに焦点を当てています。
Modular Ontology Alignment ToolkitであるTodoalignerを活用して、検索された生成(RAG)テクニックを統合することにより、このタスクに対処します。
当社のアプローチでは、サブジェクトにタグ付けの問題を調整タスクとして定式化します。ここでは、記録はセマンティックな類似性に基づいてGNDカテゴリに一致します。
被験者のインデックス作成に対するAlignerの適応性を評価し、多言語レコードの処理における有効性を分析します。
実験結果は、この方法の強みと制限を示しており、デジタルライブラリでのサブジェクトタグ付けを改善するためのアラインメント手法の可能性を強調しています。

要約(オリジナル)

This paper presents our system, Homa, for SemEval-2025 Task 5: Subject Tagging, which focuses on automatically assigning subject labels to technical records from TIBKAT using the Gemeinsame Normdatei (GND) taxonomy. We leverage OntoAligner, a modular ontology alignment toolkit, to address this task by integrating retrieval-augmented generation (RAG) techniques. Our approach formulates the subject tagging problem as an alignment task, where records are matched to GND categories based on semantic similarity. We evaluate OntoAligner’s adaptability for subject indexing and analyze its effectiveness in handling multilingual records. Experimental results demonstrate the strengths and limitations of this method, highlighting the potential of alignment techniques for improving subject tagging in digital libraries.

arxiv情報

著者 Hadi Bayrami Asl Tekanlou,Jafar Razmara,Mahsa Sanaei,Mostafa Rahgouy,Hamed Babaei Giglou
発行日 2025-04-30 09:52:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク