-
最近の投稿
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
- Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44171) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5743)
「eess.AS」カテゴリーアーカイブ
Non-native Children’s Automatic Speech Assessment Challenge (NOCASA)
要約 このペーパーでは、「非ネイティブチルドレンの自動音声評価」(NOCASA) … 続きを読む
Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion
要約 音声変換(VC)は、コンテンツを保存することにより、ソース音声をターゲット … 続きを読む
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation
要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む
Tracking Articulatory Dynamics in Speech with a Fixed-Weight BiLSTM-CNN Architecture
要約 音声生成は、さまざまな調音の特徴の調整を含む複雑な連続プロセスです。 その … 続きを読む
Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition
要約 このペーパーでは、監視なしで監視されたAL方法を組み合わせた、自動音声認識 … 続きを読む
Spatial Audio Processing with Large Language Model on Wearable Devices
要約 空間的コンテキストを大規模な言語モデル(LLM)に統合することは、特にウェ … 続きを読む
Kimi-Audio Technical Report
要約 オーディオの理解、生成、会話に優れたオープンソースオーディオファンデーショ … 続きを読む
Seeing Soundscapes: Audio-Visual Generation and Separation from Soundscapes Using Audio-Visual Separator
要約 最近の視聴覚生成モデルは、オーディオから画像を生成する際に大きな進歩を遂げ … 続きを読む
AudioX: Diffusion Transformer for Anything-to-Audio Generation
要約 オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む