-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「eess.AS」カテゴリーアーカイブ
Taming Data and Transformers for Audio Generation
要約 環境音や環境効果の生成は、データ不足とキャプションの品質が不十分なことが多 … 続きを読む
SonicSense: Object Perception from In-Hand Acoustic Vibration
要約 SonicSense は、ハードウェアとソフトウェアの総合的な設計であり、 … 続きを読む
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models
要約 このペーパーでは、大規模言語モデル (LLM) を利用して話者ダイアライゼ … 続きを読む
MSR-86K: An Evolving, Multilingual Corpus with 86,300 Hours of Transcribed Audio for Speech Recognition Research
要約 最近では、ChatGPT に代表される多言語人工知能アシスタントが非常に人 … 続きを読む
Advancing Airport Tower Command Recognition: Integrating Squeeze-and-Excitation and Broadcasted Residual Learning
要約 パイロットは航空交通管制の指示に正確に従わなければならないため、航空コマン … 続きを読む
Dynamic Data Pruning for Automatic Speech Recognition
要約 自動音声認識 (ASR) の最近の成功は、増え続けるトレーニング データの … 続きを読む
On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection
要約 深層学習の進歩に伴い、パーソナル アシスタント、感情コンピューティング、遠 … 続きを読む
AND: Audio Network Dissection for Interpreting Deep Acoustic Models
要約 ニューロンレベルの解釈は、特定の知覚または構造入力パターンに応答するニュー … 続きを読む
WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database
要約 海洋哺乳類のコミュニケーションは複雑な分野であり、発声の多様性や環境要因に … 続きを読む
Towards Building an End-to-End Multilingual Automatic Lyrics Transcription Model
要約 多言語の自動歌詞転写 (ALT) は、多言語の自動音声認識と比較して、利用 … 続きを読む