「eess.AS」カテゴリーアーカイブ

Multi-Domain Audio Question Answering Toward Acoustic Content Reasoning in The DCASE 2025 Challenge

投稿日: 2025年5月13日作成者: jarxiv

要約 DCASE 2025チャレンジのタスク5を紹介します。音響質問（AQA）ベ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Spoken Language Understanding on Unseen Tasks With In-Context Learning

投稿日: 2025年5月13日作成者: jarxiv

要約音声言語理解（SLU）タスクには、モデルの情報抽出、分類、および/または生 … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

Diffused Responsibility: Analyzing the Energy Consumption of Generative Text-to-Audio Diffusion Models

投稿日: 2025年5月13日作成者: jarxiv

要約テキストからオーディオモデルは最近、テキストの説明からサウンドを生成するた … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Lightweight End-to-end Text-to-speech Synthesis for low resource on-device applications

投稿日: 2025年5月13日作成者: jarxiv

要約最近の作品は、エンドツーエンド（E2E）ファッションのテキストからの生の波 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Learning Music Audio Representations With Limited Data

投稿日: 2025年5月12日作成者: jarxiv

要約汎用音楽の音声表現の学習に焦点を当てたものを含む音楽の大規模な学習モデルは … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

An Efficient GPU-based Implementation for Noise Robust Sound Source Localization

投稿日: 2025年5月9日作成者: jarxiv

要約サウンドソースのローカリゼーション（SSL）、サウンドソース分離（SSS） … 続きを読む →

カテゴリー: cs.RO, cs.SD, eess.AS | コメントを受け付けていません

Applications of Artificial Intelligence for Cross-language Intelligibility Assessment of Dysarthric Speech

投稿日: 2025年5月9日作成者: jarxiv

要約目的：音声明瞭度は、ダイサルリアの評価と管理における重要な結果ですが、ほと … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Hearing and Seeing Through CLIP: A Framework for Self-Supervised Sound Source Localization

投稿日: 2025年5月9日作成者: jarxiv

要約大規模なビジョン言語モデルは、多様なタスク全体で強力なマルチモーダルアライ … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Accelerating Audio Research with Robotic Dummy Heads

投稿日: 2025年5月8日作成者: jarxiv

要約この作品は、従来のオーディオロジカルマネキンの音響リアリズムとロボットの可 … 続きを読む →

カテゴリー: cs.HC, cs.RO, cs.SD, eess.AS | コメントを受け付けていません

LLAMAPIE: Proactive In-Ear Conversation Assistants

投稿日: 2025年5月8日作成者: jarxiv

要約 Lamapieを紹介します。Llamapieは、Healableデバイスを … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Multi-Domain Audio Question Answering Toward Acoustic Content Reasoning in The DCASE 2025 Challenge

Spoken Language Understanding on Unseen Tasks With In-Context Learning

Diffused Responsibility: Analyzing the Energy Consumption of Generative Text-to-Audio Diffusion Models

Lightweight End-to-end Text-to-speech Synthesis for low resource on-device applications

Learning Music Audio Representations With Limited Data

An Efficient GPU-based Implementation for Noise Robust Sound Source Localization

Applications of Artificial Intelligence for Cross-language Intelligibility Assessment of Dysarthric Speech

Hearing and Seeing Through CLIP: A Framework for Self-Supervised Sound Source Localization

Accelerating Audio Research with Robotic Dummy Heads

LLAMAPIE: Proactive In-Ear Conversation Assistants

最近の投稿

最近のコメント

アーカイブ

カテゴリー