-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Development of Hybrid ASR Systems for Low Resource Medical Domain Conversational Telephone Speech
要約 ますますつながりが増し、グローバル化が進む世界では、言語の壁が大きな課題と … 続きを読む
Dynamic ASR Pathways: An Adaptive Masking Approach Towards Efficient Pruning of A Multilingual ASR Model
要約 ニューラル ネットワーク プルーニングは、パフォーマンスの損失を最小限に抑 … 続きを読む
Memory-augmented conformer for improved end-to-end long-form ASR
要約 コンフォーマーは最近、自動音声認識 (ASR) の有望なモデリング アプロ … 続きを読む
Audio Contrastive based Fine-tuning
要約 音声分類は、幅広い用途の音声および音声処理タスクにおいて重要な役割を果たし … 続きを読む
Passage Summarization with Recurrent Models for Audio-Sheet Music Retrieval
要約 クロスモーダル音楽検索の多くのアプリケーションは、楽譜の画像をオーディオ録 … 続きを読む
Self-Supervised Contrastive Learning for Robust Audio-Sheet Music Retrieval Systems
要約 楽譜画像をオーディオ録音にリンクすることは、効率的なクロスモーダル音楽検索 … 続きを読む
Towards Robust and Truly Large-Scale Audio-Sheet Music Retrieval
要約 マルチモーダル音楽情報検索のさまざまなアプリケーションは、楽譜 (画像) … 続きを読む
t-EER: Parameter-Free Tandem Evaluation of Countermeasures and Biometric Comparators
要約 プレゼンテーション攻撃 (スプーフィング) 検出 (PAD) は通常、生体 … 続きを読む
Weakly-supervised Automated Audio Captioning via text only training
要約 近年、オーディオとキャプションのペアのデータセットにより、オーディオ クリ … 続きを読む
Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis
要約 記号的な音楽表現から複数の楽器による音楽を生成することは、音楽情報検索 ( … 続きを読む