Tackling Low-Resourced Sign Language Translation: UPC at WMT-SLT 22

要約

本論文では、Workshop on Machine Translation 2022 Sign Language Translation Task のためにUniversitat Polit`ecnica de Catalunyaで開発したシステム、特に、sign-to-text 方向の翻訳について述べる。我々は、Fairseqモデリングツールキットを用いて実装されたTransformerモデルを使用する。PHOENIX-14Tデータセットを用いて、語彙サイズ、データ拡張技術、モデルの事前学習について実験を行った。本システムはテストセットにおいて0.50 BLEUを獲得し、主催者のベースラインを0.38 BLEU上回った。この結果は、ベースラインと我々のシステムの両方が低いものであり、我々の知見の信頼性が低いことを指摘するものである。

要約(オリジナル)

This paper describes the system developed at the Universitat Polit\`ecnica de Catalunya for the Workshop on Machine Translation 2022 Sign Language Translation Task, in particular, for the sign-to-text direction. We use a Transformer model implemented with the Fairseq modeling toolkit. We have experimented with the vocabulary size, data augmentation techniques and pretraining the model with the PHOENIX-14T dataset. Our system obtains 0.50 BLEU score for the test set, improving the organizers’ baseline by 0.38 BLEU. We remark the poor results for both the baseline and our system, and thus, the unreliability of our findings.

arxiv情報

著者 Laia Tarrés,Gerard I. Gàllego,Xavier Giró-i-Nieto,Jordi Torres
発行日 2022-12-02 12:42:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.CV パーマリンク