-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation
要約 音楽と言語のモデルを評価するために設計された、高品質のオーディオとキャプシ … 続きを読む
R-Spin: Efficient Speaker and Noise-invariant Representation Learning with Acoustic Pieces
要約 この論文では、話者不変クラスタリング (Spin) を使用して離散音響単位 … 続きを読む
Can MusicGen Create Training Data for MIR Tasks?
要約 私たちは、AI ベースの音楽生成システムを使用して音楽情報検索 (MIR) … 続きを読む
Open-vocabulary keyword spotting in any language through multilingual contrastive speech-phoneme pretraining
要約 この論文では、多様な言語族の 115 以上の言語を網羅する、きめ細かい音素 … 続きを読む
Retrieve and Copy: Scaling ASR Personalization to Large Catalogs
要約 自動音声認識 (ASR) モデルのパーソナライゼーションは、多くの実用的な … 続きを読む
Unified Segment-to-Segment Framework for Simultaneous Sequence Generation
要約 同時シーケンス生成は、ストリーミング音声認識、同時機械翻訳、同時音声翻訳な … 続きを読む
Exploring Variational Auto-Encoder Architectures, Configurations, and Datasets for Generative Music Explainable AI
要約 音楽や芸術全般の生成 AI モデルはますます複雑になり、理解するのが難しく … 続きを読む
Zero-shot audio captioning with audio-language model guidance and audio context keywords
要約 ゼロショット オーディオ キャプションは、このタスクのための事前トレーニン … 続きを読む
Unsupervised Musical Object Discovery from Audio
要約 人気の SlotAttendant アーキテクチャなどの現在のオブジェクト … 続きを読む
Unsupervised Musical Object Discovery from Audio
要約 人気の SlotAttendant アーキテクチャなどの現在のオブジェクト … 続きを読む