「cs.SD」カテゴリーアーカイブ

Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning

投稿日: 2024年4月8日作成者: jarxiv

要約最近の研究活動の増加にもかかわらず、深層学習モデルは医療などのいくつかの実 … 続きを読む →

カテゴリー: cs.LG, cs.SD, q-bio.QM | コメントを受け付けていません

Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context

投稿日: 2024年4月8日作成者: jarxiv

要約アフリカの音声のみを対象としてトレーニングされた、最初の自己教師あり多言語 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Multi-Task Learning for Lung sound & Lung disease classification

投稿日: 2024年4月8日作成者: jarxiv

要約近年、ディープラーニング技術の進歩により、医療診断の効率と精度が大幅に向上 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD | コメントを受け付けていません

As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli

投稿日: 2024年4月5日作成者: jarxiv

要約合成メディアが次第にリアルになり、それを利用する障壁が下がり続けるにつれ、 … 続きを読む →

カテゴリー: 68T01, cs.AI, cs.HC, cs.SD, eess.AS, I.2 | コメントを受け付けていません

Analyzing Musical Characteristics of National Anthems in Relation to Global Indices

投稿日: 2024年4月5日作成者: jarxiv

要約音楽は人々の心理や行動パターンの形成に大きな役割を果たしている。本論文では … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.SD, eess.AS | コメントを受け付けていません

UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions

投稿日: 2024年4月4日作成者: jarxiv

要約最近の研究では、マルチタスク機能を持つ大規模な言語モデルを活用し、自然言語 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

PromptCodec: High-Fidelity Neural Speech Codec using Disentangled Representation Learning based Adaptive Feature-aware Prompt Encoders

投稿日: 2024年4月4日作成者: jarxiv

要約ニューラル・スピーチ・コーデックは、音声変換、テキスト音声合成などのような … 続きを読む →

カテゴリー: cs.AI, cs.SD | コメントを受け付けていません

Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials

投稿日: 2024年4月3日作成者: jarxiv

要約臨床試験には相当数の臨床医、患者、データ収集環境が関与するため、優れた品質 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context

投稿日: 2024年4月3日作成者: jarxiv

要約アフリカの音声のみを対象としてトレーニングされた、最初の自己教師あり多言語 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task

投稿日: 2024年4月3日作成者: jarxiv

要約会話は人間のコミュニケーションの最も自然な形式であり、それぞれの発話がさま … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning

Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context

Multi-Task Learning for Lung sound & Lung disease classification

As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli

Analyzing Musical Characteristics of National Anthems in Relation to Global Indices

UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions

PromptCodec: High-Fidelity Neural Speech Codec using Disentangled Representation Learning based Adaptive Feature-aware Prompt Encoders

Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials

Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context

LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task

最近の投稿

最近のコメント

アーカイブ

カテゴリー