eess.AS」カテゴリーアーカイブ

Analyzing Musical Characteristics of National Anthems in Relation to Global Indices

要約 音楽は人々の心理や行動パターンの形成に大きな役割を果たしている。本論文では … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.SD, eess.AS | Analyzing Musical Characteristics of National Anthems in Relation to Global Indices はコメントを受け付けていません

The VoicePrivacy 2024 Challenge Evaluation Plan

要約 この課題の課題は、言語的な内容や感情の状態を保護しつつ、話者の声の身元を隠 … 続きを読む

カテゴリー: cs.CL, cs.CR, eess.AS | The VoicePrivacy 2024 Challenge Evaluation Plan はコメントを受け付けていません

Encoding of lexical tone in self-supervised models of spoken language

要約 解釈可能性の研究により、自己教師付き音声言語モデル(SLM)は、音響、音声 … 続きを読む

カテゴリー: cs.CL, eess.AS | Encoding of lexical tone in self-supervised models of spoken language はコメントを受け付けていません

ART: The Alternating Reading Task Corpus for Speech Entrainment and Imitation

要約 音声コミュニケーションにおける同調行動と模倣行動を研究するために、二人組に … 続きを読む

カテゴリー: cs.CL, eess.AS | ART: The Alternating Reading Task Corpus for Speech Entrainment and Imitation はコメントを受け付けていません

UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions

要約 最近の研究では、マルチタスク機能を持つ大規模な言語モデルを活用し、自然言語 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions はコメントを受け付けていません

Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials

要約 臨床試験には相当数の臨床医、患者、データ収集環境が関与するため、優れた品質 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials はコメントを受け付けていません

Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context

要約 アフリカの音声のみを対象としてトレーニングされた、最初の自己教師あり多言語 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context はコメントを受け付けていません

LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task

要約 会話は人間のコミュニケーションの最も自然な形式であり、それぞれの発話がさま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task はコメントを受け付けていません

MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response

要約 大規模言語モデル (LLM) は、マルチモーダルなアプリケーションにおいて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response はコメントを受け付けていません

SPMamba: State-space model is all you need in speech separation

要約 音声分離では、CNN ベースのモデルと Transformer ベースのモ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | SPMamba: State-space model is all you need in speech separation はコメントを受け付けていません