eess.AS」カテゴリーアーカイブ

Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback

要約 テキストレスの音声言語モデル(SLM)は、エンドツーエンドの音声からスピー … 続きを読む

カテゴリー: cs.CL, eess.AS | Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback はコメントを受け付けていません

Bridging The Multi-Modality Gaps of Audio, Visual and Linguistic for Speech Enhancement

要約 音声強化(SE)は、騒々しい環境での音声の品質と明瞭度を改善することを目的 … 続きを読む

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS | Bridging The Multi-Modality Gaps of Audio, Visual and Linguistic for Speech Enhancement はコメントを受け付けていません

DeepDialogue: A Multi-Turn Emotionally-Rich Spoken Dialogue Dataset

要約 会話型AIの最近の進歩は、単一ターン応答の印象的な能力を実証していますが、 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | DeepDialogue: A Multi-Turn Emotionally-Rich Spoken Dialogue Dataset はコメントを受け付けていません

Multi-modal brain encoding models for multi-modal stimuli

要約 画像やサイレントビデオを視聴するなどの単峰性刺激に従事している参加者にもか … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, eess.AS, eess.IV, q-bio.NC | Multi-modal brain encoding models for multi-modal stimuli はコメントを受け付けていません

Automated data curation for self-supervised learning in underwater acoustic analysis

要約 海洋生態系の持続可能性は、健全な汚染のレベルの増加によって脅かされており、 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Automated data curation for self-supervised learning in underwater acoustic analysis はコメントを受け付けていません

Bemba Speech Translation: Exploring a Low-Resource African Language

要約 このホワイトペーパーでは、スポークン言語翻訳に関する国際会議(IWSLT … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Bemba Speech Translation: Exploring a Low-Resource African Language はコメントを受け付けていません

MVP: Multi-source Voice Pathology detection

要約 音声障害は、患者の生活の質に大きな影響を与えますが、病的な音声データの希少 … 続きを読む

カテゴリー: cs.CL, eess.AS | MVP: Multi-source Voice Pathology detection はコメントを受け付けていません

‘Alexa, can you forget me?’ Machine Unlearning Benchmark in Spoken Language Understanding

要約 機械学習モデルから特定の情報を効率的に削除するプロセスであるマシンの未学習 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ‘Alexa, can you forget me?’ Machine Unlearning Benchmark in Spoken Language Understanding はコメントを受け付けていません

Exploring Generative Error Correction for Dysarthric Speech Recognition

要約 エンドツーエンドの自動音声認識(ASR)エンジンの驚くべき進歩にもかかわら … 続きを読む

カテゴリー: cs.CL, eess.AS | Exploring Generative Error Correction for Dysarthric Speech Recognition はコメントを受け付けていません

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

要約 Kolmogorov-Arnold Networks(KANS)は最近、従 … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | ‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding はコメントを受け付けていません