「eess.AS」カテゴリーアーカイブ

Testing LLMs’ Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT

投稿日: 2025年4月22日作成者: jarxiv

要約この研究では、エラーの類型に基づいてMT出力に注釈を付ける際に、大規模な言 … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion

投稿日: 2025年4月21日作成者: jarxiv

要約画像合成に大きな成功を示した後、生成敵対的ネットワーク（GAN）モデルは同 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting

投稿日: 2025年4月21日作成者: jarxiv

要約人間のスピーチは、情報の単なる転送を超えています。それは感情の深いやり取 … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting

投稿日: 2025年4月18日作成者: jarxiv

要約人間のスピーチは、情報の単なる転送を超えています。それは感情の深いやり取 … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition

投稿日: 2025年4月18日作成者: jarxiv

要約水中音響ターゲット認識（UATR）は、海洋の多様性と国防の安全を保護するた … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

投稿日: 2025年4月18日作成者: jarxiv

要約 Sift（音声指導の微調整）、音声テキスト大規模言語モデル（LLM）の指示 … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

Dysarthria Normalization via Local Lie Group Transformations for Robust ASR

投稿日: 2025年4月17日作成者: jarxiv

要約スペクトログラムのローカルリーグループ変換を使用して、ダイサルトリック音声 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Taming Data and Transformers for Audio Generation

投稿日: 2025年4月17日作成者: jarxiv

要約アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning

投稿日: 2025年4月16日作成者: jarxiv

要約喘息は、世界中の何百万人もの人々に影響を与える慢性呼吸条件です。この状態 … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.AS | コメントを受け付けていません

SpoofCeleb: Speech Deepfake Detection and SASV In The Wild

投稿日: 2025年4月16日作成者: jarxiv

要約このペーパーでは、音声ディープファーク検出（SDD）およびスプーフィングの … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Testing LLMs’ Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT

Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion

EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting

EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting

A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

Dysarthria Normalization via Local Lie Group Transformations for Robust ASR

Taming Data and Transformers for Audio Generation

Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning

SpoofCeleb: Speech Deepfake Detection and SASV In The Wild

最近の投稿

最近のコメント

アーカイブ

カテゴリー