-
最近の投稿
- Open Challenges in the Formal Verification of Autonomous Driving
- Maximum Solar Energy Tracking Leverage High-DoF Robotics System with Deep Reinforcement Learning
- EdgeFlowNet: 100FPS@1W Dense Optical Flow For Tiny Mobile Robots
- A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (30057) cs.CL (22703) cs.CR (2332) cs.CV (36430) cs.LG (34881) cs.RO (17454) cs.SY (2679) eess.IV (4437) eess.SY (2673) stat.ML (4648)
「eess.AS」カテゴリーアーカイブ
The FruitShell French synthesis system at the Blizzard 2023 Challenge
要約 この論文では、Blizzard Challenge 2023 用のフランス … 続きを読む
Towards Rehearsal-Free Multilingual ASR: A LoRA-based Case Study on Whisper
要約 Whisper のような、事前トレーニングされた多言語音声基礎モデルは、さ … 続きを読む
Disentangling segmental and prosodic factors to non-native speech comprehensibility
要約 現在のアクセント変換 (AC) システムは、非ネイティブ アクセントの 2 … 続きを読む
A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection
要約 この論文では、堅牢なオーディオビジュアルディープフェイク検出モデルを開発す … 続きを読む
Convert and Speak: Zero-shot Accent Conversion with Minimum Supervision
要約 並列データのリソースが少ないことは、発音単位と韻律パターンの両方を変換する … 続きを読む
Enhancing Partially Spoofed Audio Localization with Boundary-aware Attention Mechanism
要約 部分的にスプーフィングされたオーディオ位置特定のタスクは、フレーム レベル … 続きを読む
Advancing Voice Cloning for Nepali: Leveraging Transfer Learning in a Low-Resource Language
要約 音声クローン作成は、パーソナライズされた音声インターフェイスの顕著な機能で … 続きを読む
MAT-SED: A Masked Audio Transformer with Masked-Reconstruction Based Pre-training for Sound Event Detection
要約 大規模な事前トレーニング済み Transformer エンコーダ ネットワ … 続きを読む
What Do Language Models Hear? Probing for Auditory Representations in Language Models
要約 この研究では、言語モデルが物体の音の意味のある根拠に基づいた表現をエンコー … 続きを読む
ConcateNet: Dialogue Separation Using Local And Global Feature Concatenation
要約 対話の分離には、映画やテレビ番組などの混合物から対話信号を分離することが含 … 続きを読む