eess.AS」カテゴリーアーカイブ

ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation

要約 マルチモーダル Federated Learning では、クライアント … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation はコメントを受け付けていません

Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)

要約 Explainable AI for the Arts (XAIxArts … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS | Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) はコメントを受け付けていません

A Functional Trade-off between Prosodic and Semantic Cues in Conveying Sarcasm

要約 この研究では、皮肉の音響的特徴を調査し、皮肉として使用される発話の傾向と皮 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | A Functional Trade-off between Prosodic and Semantic Cues in Conveying Sarcasm はコメントを受け付けていません

Speech Recognition Transformers: Topological-lingualism Perspective

要約 トランスフォーマーは、さまざまな人工知能タスクにおいて大きな成功を収めなが … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Speech Recognition Transformers: Topological-lingualism Perspective はコメントを受け付けていません

Unlocking Potential in Pre-Trained Music Language Models for Versatile Multi-Track Music Arrangement

要約 大規模な言語モデルは、記号音楽の生成など、さまざまな領域にわたって重要な機 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Unlocking Potential in Pre-Trained Music Language Models for Versatile Multi-Track Music Arrangement はコメントを受け付けていません

Infusing Acoustic Pause Context into Text-Based Dementia Assessment

要約 音声の一時停止は、内容や構造と並んで、認知症を検出するための貴重で非侵襲的 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Infusing Acoustic Pause Context into Text-Based Dementia Assessment はコメントを受け付けていません

Human Perception of Audio Deepfakes

要約 最近のディープフェイクの出現により、操作され生成されたコンテンツが機械学習 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS | Human Perception of Audio Deepfakes はコメントを受け付けていません

Foundation Models for Music: A Survey

要約 近年、大規模言語モデル (LLM) や潜在拡散モデル (LDM) などの基 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Foundation Models for Music: A Survey はコメントを受け付けていません

Self-supervised Speech Representations Still Struggle with African American Vernacular English

要約 アフリカ系アメリカ人固有英語 (AAVE) やその他の疎外された言語変種の … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Self-supervised Speech Representations Still Struggle with African American Vernacular English はコメントを受け付けていません

Hierarchical Generative Modeling of Melodic Vocal Contours in Hindustani Classical Music

要約 ヒンドゥスターニ音楽は、豊かな旋律パターンの演奏を示す、演奏主導の口承伝統 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | Hierarchical Generative Modeling of Melodic Vocal Contours in Hindustani Classical Music はコメントを受け付けていません