-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
「cs.SD」カテゴリーアーカイブ
Calibration of Multiple Asynchronous Microphone Arrays using Hybrid TDOA
要約 複数の非同期マイクアレイで作られた音響センシングシステムの正確なキャリブレ … 続きを読む
Improved Extrinsic Calibration of Acoustic Cameras via Batch Optimization
要約 アコースティックカメラでは、実際には多くのアプリケーションが見つかりました … 続きを読む
Evaluation of Deep Audio Representations for Hearables
要約 効果的に聞こえるデバイスには、ユーザーの周りの音響環境を理解する必要があり … 続きを読む
Exploring Audio Editing Features as User-Centric Privacy Defenses Against Large Language Model(LLM) Based Emotion Inference Attacks
要約 仮想アシスタント、ビデオ会議プラットフォーム、ウェアラブルデバイスなどの音 … 続きを読む
Learning Musical Representations for Music Performance Question Answering
要約 音楽パフォーマンスは、視聴覚モデリングの代表的なシナリオです。 まばらなオ … 続きを読む
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning
要約 このペーパーでは、生の波形に直接適用されるリアルタイムの因果オーディオ除去 … 続きを読む
Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound
要約 オーディオ美学の定量化は、主にその主観的な性質のために、人間の認識と文化的 … 続きを読む
Evaluating Standard and Dialectal Frisian ASR: Multilingual Fine-tuning and Language Identification for Improved Low-resource Performance
要約 低リソース言語の自動音声認識(ASR)パフォーマンスは、十分なラベル付きデ … 続きを読む
Latent Swap Joint Diffusion for Long-Form Audio Generation
要約 グローバルビューの拡散または反復生成を使用した長期のオーディオ生成に関する … 続きを読む