-
最近の投稿
- Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees
- FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality
- Enhanced Robot Planning and Perception through Environment Prediction
- FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning
- Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator
-
最近のコメント
表示できるコメントはありません。 cs.AI (27989) cs.CL (21147) cs.CR (2187) cs.CV (34671) cs.LG (32719) cs.RO (16074) cs.SY (2489) eess.IV (4240) eess.SY (2483) stat.ML (4382)
「cs.SD」カテゴリーアーカイブ
What You Hear Is What You See: Audio Quality Metrics From Image Quality Metrics
要約 この研究では、オーディオ信号をスペクトログラムとして表すことにより、オーデ … 続きを読む
a unified front-end framework for english text-to-speech synthesis
要約 フロントエンドは英語音声合成 (TTS) システムの重要なコンポーネントで … 続きを読む
Killing two birds with one stone: Can an audio captioning system also be used for audio-text retrieval?
要約 自動音声キャプション (AAC) は、テキスト文を使用して音声録音を説明で … 続きを読む
OLISIA: a Cascade System for Spoken Dialogue State Tracking
要約 Dialogue State Tracking (DST) は音声対話シス … 続きを読む
Let There Be Sound: Reconstructing High Quality Speech from Silent Videos
要約 この研究の目標は、唇の動きだけから高品質の音声を再構築することであり、この … 続きを読む
Spoken Language Intelligence of Large Language Models for Language Learning
要約 人々は長い間、実生活の状況を支援できる会話システムを望んできましたが、大規 … 続きを読む
AudioFormer: Audio Transformer learns audio feature representations from discrete acoustic codes
要約 我々は、AudioFormer という名前のメソッドを提案します。このメソ … 続きを読む
How to Estimate Model Transferability of Pre-Trained Speech Models?
要約 この研究では、ターゲット タスクを微調整するための事前トレーニング済み音声 … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 この論文では、幼児の泣き声のラベル付きコレクションである Ubenwa C … 続きを読む