cs.SD」カテゴリーアーカイブ

Audio-Visual Deepfake Detection With Local Temporal Inconsistencies

要約 このペーパーでは、オーディオと視覚モダリティの間のきめの細かい時間的矛盾を … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | Audio-Visual Deepfake Detection With Local Temporal Inconsistencies はコメントを受け付けていません

NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields

要約 サウンドは、人間の知覚において大きな役割を果たします。 ビジョンに加えて、 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields はコメントを受け付けていません

Separate This, and All of these Things Around It: Music Source Separation via Hyperellipsoidal Queries

要約 音楽ソースの分離は、音楽のオーディオ混合物から1つ以上の構成要素またはその … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SD, eess.AS | Separate This, and All of these Things Around It: Music Source Separation via Hyperellipsoidal Queries はコメントを受け付けていません

What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain

要約 Audio Deepfake Detection(ADD)モデルに説明を追 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain はコメントを受け付けていません

Enhancing and Exploring Mild Cognitive Impairment Detection with W2V-BERT-2.0

要約 この研究では、タウカディアル横断データセットを使用して軽度認知障害(MCI … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enhancing and Exploring Mild Cognitive Impairment Detection with W2V-BERT-2.0 はコメントを受け付けていません

LUCY: Linguistic Understanding and Control Yielding Early Stage of Her

要約 彼女の映画は、人間の発話において言語的および麻痺性情報の両方を理解し、自然 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LUCY: Linguistic Understanding and Control Yielding Early Stage of Her はコメントを受け付けていません

Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes

要約 シングルチャネルの音声分離アプローチ、乾燥音声混合物は大幅に改善されました … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes はコメントを受け付けていません

What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain

要約 音声ディープフェイク検出 (ADD) モデルに説明を追加すると、意思決定プ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain はコメントを受け付けていません

Musical ethnocentrism in Large Language Models

要約 大規模言語モデル (LLM) は、トレーニング データのバイアス、ひいては … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Musical ethnocentrism in Large Language Models はコメントを受け付けていません

Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak はコメントを受け付けていません