Improving Drumming Robot Via Attention Transformer Network

要約

ロボット技術は現代社会に広く普及し、農業、製造業、エンターテインメントなどさまざまな分野で大きな進歩を遂げています。
この論文では、エンターテインメントにおける太鼓ロボットのトピックに焦点を当てます。
この目的を達成するために、アテンション メカニズムに基づいた人気のビジョン トランスフォーマー ネットワークに基づいて音楽の転写を自動的に完了できる改良されたドラム演奏ロボットを導入します。
アテンショントランスネットワークを備えた私たちの方法は、シーケンシャルオーディオエンベディング入力を効率的に処理し、そのグローバルな長距離依存関係をモデル化できます。
大量の実験結果は、改良されたアルゴリズムがドラム演奏ロボットのドラム分類パフォーマンスを促進するのに役立ち、ロボットがさまざまなスマート アプリケーションやサービスを享受するのにも役立つことを示しています。

要約(オリジナル)

Robotic technology has been widely used in nowadays society, which has made great progress in various fields such as agriculture, manufacturing and entertainment. In this paper, we focus on the topic of drumming robots in entertainment. To this end, we introduce an improving drumming robot that can automatically complete music transcription based on the popular vision transformer network based on the attention mechanism. Equipped with the attention transformer network, our method can efficiently handle the sequential audio embedding input and model their global long-range dependencies. Massive experimental results demonstrate that the improving algorithm can help the drumming robot promote drum classification performance, which can also help the robot to enjoy a variety of smart applications and services.

arxiv情報

著者 Yang Yi,Zonghan Li
発行日 2023-10-04 03:55:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク