-
最近の投稿
- Nearest-Neighbourless Asymptotically Optimal Motion Planning with Fully Connected Informed Trees (FCIT*)
- Performance assessment of ADAS in a representative subset of critical traffic situations
- Exciting Contact Modes in Differentiable Simulations for Robot Learning
- Can LLMs plan paths in the real world?
- DECODE: Domain-aware Continual Domain Expansion for Motion Prediction
-
最近のコメント
表示できるコメントはありません。 cs.AI (30257) cs.CL (22857) cs.CR (2346) cs.CV (36632) cs.LG (35077) cs.RO (17603) cs.SY (2704) eess.IV (4458) eess.SY (2698) stat.ML (4675)
「eess.AS」カテゴリーアーカイブ
Integrating Pre-Trained Speech and Language Models for End-to-End Speech Recognition
要約 機械学習の進歩により、自動音声認識 (ASR) などのさまざまなテキストお … 続きを読む
RECAP: Retrieval-Augmented Audio Captioning
要約 RECAP (REtrieval-Augmented Audio CAPt … 続きを読む
Robots Have Been Seen and Not Heard: Effects of Consequential Sounds on Human-Perception of Robots
要約 多くの人は、ロボットがかなり静かに動くこと、あるいはロボットのビデオで見た … 続きを読む
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids
要約 この文書では、補聴器ユーザー向けに調整された音楽音質評価のための非侵入型デ … 続きを読む
The PESQetarian: On the Relevance of Goodhart’s Law for Speech Enhancement
要約 改善された音声強調モデルを取得するために、研究者は多くの場合、特定の計測基 … 続きを読む
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning
要約 トランスフォーマーは、CNN に基づく方法を超えて、急速にオーディオ分類に … 続きを読む
Language-Universal Speech Attributes Modeling for Zero-Shot Multilingual Spoken Keyword Recognition
要約 我々は、(i) 自己教師付きの事前トレーニング済みモデル、および (ii) … 続きを読む
Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters
要約 Mixture of Experts (MoE) アーキテクチャは、手頃な … 続きを読む
Explainable Deep Learning Analysis for Raga Identification in Indian Art Music
要約 ラーガ識別のタスクは、音楽情報検索において非常に人気のある研究課題です。 … 続きを読む
How Do Neural Spoofing Countermeasures Detect Partially Spoofed Audio?
要約 文章を部分的に操作すると、その意味が大きく変わってしまいます。 最近の研究 … 続きを読む