-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.SD」カテゴリーアーカイブ
Novel-View Acoustic Synthesis from 3D Reconstructed Rooms
要約 私たちは、ブラインド オーディオ録音と 3D シーン情報を組み合わせて、新 … 続きを読む
Definition-independent Formalization of Soundscapes: Towards a Formal Methodology
要約 サウンドスケープは、さまざまな分野の研究者によって研究されており、それぞれ … 続きを読む
Two-Stage Triplet Loss Training with Curriculum Augmentation for Audio-Visual Retrieval
要約 クロスモーダル検索モデルは、三重損失最適化の可能性を活用して、堅牢な埋め込 … 続きを読む
Audio Editing with Non-Rigid Text Prompts
要約 このペーパーでは、非固定テキスト編集によるオーディオ編集について検討します … 続きを読む
Voicebox: Text-Guided Multilingual Universal Speech Generation at Scale
要約 GPT や DALL-E などの大規模な生成モデルは、研究コミュニティに革 … 続きを読む
EmoDiarize: Speaker Diarization and Emotion Identification from Speech Signals using Convolutional Neural Networks
要約 高度な人工知能と人間とコンピューターの対話の時代では、話し言葉で感情を識別 … 続きを読む
Reinforcement Learning and Bandits for Speech and Language Processing: Tutorial, Review and Outlook
要約 近年、強化学習とバンディットは、ヘルスケア、金融、レコメンデーション シス … 続きを読む
Analysis and Detection of Pathological Voice using Glottal Source Features
要約 音声の病状を自動検出することで、客観的な評価と早期の診断介入が可能になりま … 続きを読む
Wav2vec-based Detection and Severity Level Classification of Dysarthria from Speech
要約 音響音声信号から直接、構音障害を自動検出および重症度レベル分類することは、 … 続きを読む
The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation
要約 エンドツーエンドの音声言語理解 (SLU) は、テキストと音声に関する現在 … 続きを読む