「eess.AS」カテゴリーアーカイブ

Measuring Entrainment in Spontaneous Code-switched Speech

投稿日: 2024年3月27日作成者: jarxiv

要約互いに同調する話者は、そうでない話者よりも会話がうまくいくことはよく知られ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli

投稿日: 2024年3月27日作成者: jarxiv

要約合成メディアが徐々に現実味を増し、その使用の障壁が低くなり続けるにつれて、 … 続きを読む →

カテゴリー: 68T01, cs.AI, cs.HC, cs.SD, eess.AS, I.2 | コメントを受け付けていません

Training Generative Adversarial Network-Based Vocoder with Limited Data Using Augmentation-Conditional Discriminator

投稿日: 2024年3月26日作成者: jarxiv

要約敵対的弁別器でトレーニングされた敵対的生成ネットワーク (GAN) ベース … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Distributed collaborative anomalous sound detection by embedding sharing

投稿日: 2024年3月26日作成者: jarxiv

要約機械音監視システムを開発するために、異常音を検出する手法が提案されている。 … 続きを読む →

カテゴリー: cs.CR, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

A unified front-end framework for English text-to-speech synthesis

投稿日: 2024年3月26日作成者: jarxiv

要約フロントエンドは英語音声合成 (TTS) システムの重要なコンポーネントで … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

As Good As A Coin Toss Human detection of AI-generated images, videos, audio, and audiovisual stimuli

投稿日: 2024年3月26日作成者: jarxiv

要約合成メディアが徐々に現実味を増し、その使用の障壁が低くなり続けるにつれて、 … 続きを読む →

カテゴリー: 68T01, cs.AI, cs.HC, cs.SD, eess.AS, I.2 | コメントを受け付けていません

Dynamic-SUPERB: Towards A Dynamic, Collaborative, and Comprehensive Instruction-Tuning Benchmark for Speech

投稿日: 2024年3月25日作成者: jarxiv

要約テキスト言語モデルは、適切に定式化された指示が提供された場合、目に見えない … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition

投稿日: 2024年3月25日作成者: jarxiv

要約顕著な進歩にもかかわらず、音声感情認識 (SER) は、特に野生の世界では … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Unimodal Multi-Task Fusion for Emotional Mimicry Prediction

投稿日: 2024年3月25日作成者: jarxiv

要約この研究では、第 6 回ワークショップおよび野外での感情行動分析に関するコ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds

投稿日: 2024年3月24日作成者: jarxiv

要約この論文では、乳児の泣き声にラベルを付けたコレクションである Ubenwa … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Measuring Entrainment in Spontaneous Code-switched Speech

As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli

Training Generative Adversarial Network-Based Vocoder with Limited Data Using Augmentation-Conditional Discriminator

Distributed collaborative anomalous sound detection by embedding sharing

A unified front-end framework for English text-to-speech synthesis

As Good As A Coin Toss Human detection of AI-generated images, videos, audio, and audiovisual stimuli

Dynamic-SUPERB: Towards A Dynamic, Collaborative, and Comprehensive Instruction-Tuning Benchmark for Speech

MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition

Unimodal Multi-Task Fusion for Emotional Mimicry Prediction

CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds

最近の投稿

最近のコメント

アーカイブ

カテゴリー