「eess.AS」カテゴリーアーカイブ

Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback

投稿日: 2025年5月28日作成者: jarxiv

要約テキストレスの音声言語モデル（SLM）は、エンドツーエンドの音声からスピー … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Bridging The Multi-Modality Gaps of Audio, Visual and Linguistic for Speech Enhancement

投稿日: 2025年5月27日作成者: jarxiv

要約音声強化（SE）は、騒々しい環境での音声の品質と明瞭度を改善することを目的 … 続きを読む →

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

DeepDialogue: A Multi-Turn Emotionally-Rich Spoken Dialogue Dataset

投稿日: 2025年5月27日作成者: jarxiv

要約会話型AIの最近の進歩は、単一ターン応答の印象的な能力を実証していますが、 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Multi-modal brain encoding models for multi-modal stimuli

投稿日: 2025年5月27日作成者: jarxiv

要約画像やサイレントビデオを視聴するなどの単峰性刺激に従事している参加者にもか … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, eess.AS, eess.IV, q-bio.NC | コメントを受け付けていません

Automated data curation for self-supervised learning in underwater acoustic analysis

投稿日: 2025年5月27日作成者: jarxiv

要約海洋生態系の持続可能性は、健全な汚染のレベルの増加によって脅かされており、 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Bemba Speech Translation: Exploring a Low-Resource African Language

投稿日: 2025年5月27日作成者: jarxiv

要約このホワイトペーパーでは、スポークン言語翻訳に関する国際会議（IWSLT … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

MVP: Multi-source Voice Pathology detection

投稿日: 2025年5月27日作成者: jarxiv

要約音声障害は、患者の生活の質に大きな影響を与えますが、病的な音声データの希少 … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

‘Alexa, can you forget me?’ Machine Unlearning Benchmark in Spoken Language Understanding

投稿日: 2025年5月27日作成者: jarxiv

要約機械学習モデルから特定の情報を効率的に削除するプロセスであるマシンの未学習 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Exploring Generative Error Correction for Dysarthric Speech Recognition

投稿日: 2025年5月27日作成者: jarxiv

要約エンドツーエンドの自動音声認識（ASR）エンジンの驚くべき進歩にもかかわら … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

投稿日: 2025年5月27日作成者: jarxiv

要約 Kolmogorov-Arnold Networks（KANS）は最近、従 … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback

Bridging The Multi-Modality Gaps of Audio, Visual and Linguistic for Speech Enhancement

DeepDialogue: A Multi-Turn Emotionally-Rich Spoken Dialogue Dataset

Multi-modal brain encoding models for multi-modal stimuli

Automated data curation for self-supervised learning in underwater acoustic analysis

Bemba Speech Translation: Exploring a Low-Resource African Language

MVP: Multi-source Voice Pathology detection

‘Alexa, can you forget me?’ Machine Unlearning Benchmark in Spoken Language Understanding

Exploring Generative Error Correction for Dysarthric Speech Recognition

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

最近の投稿

最近のコメント

アーカイブ

カテゴリー