-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
RealImpact: A Dataset of Impact Sound Fields for Real Objects
要約 物体は、さまざまな摂動、環境条件、リスナーに対する姿勢の下で独特の音を出し … 続きを読む
Few-shot bioacoustic event detection at the DCASE 2023 challenge
要約 フューショット生体音響イベント検出では、対象クラスの少数の例のみにアクセス … 続きを読む
Pushing the Limits of Unsupervised Unit Discovery for SSL Speech Representation
要約 音声基礎モデルの自己教師あり学習 (SSL) の優れた一般化能力が大きな注 … 続きを読む
KIT’s Multilingual Speech Translation System for IWSLT 2023
要約 既存の音声翻訳ベンチマークの多くは、高品質の録音条件でのネイティブ英語の音 … 続きを読む
Inconsistency Ranking-based Noisy Label Detection for High-quality Data
要約 ディープラーニングを成功させるには、注釈付きの高品質で大量のデータが必要で … 続きを読む
Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language
要約 現在の自己教師あり学習アルゴリズムはモダリティ固有であることが多く、大量の … 続きを読む
Audio Tagging on an Embedded Hardware Platform
要約 畳み込みニューラル ネットワーク (CNN) は、さまざまな音声分類タスク … 続きを読む
ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech Recognition and Natural Language Understanding of Air Traffic Control Communications
要約 パーソナル アシスタント、自動音声認識装置、対話理解システムは、相互接続さ … 続きを読む
Unsupervised speech enhancement with deep dynamical generative speech and noise models
要約 この研究は、クリーン音声モデルとして動的変分オートエンコーダ (DVAE) … 続きを読む
Modality Adaption or Regularization? A Case Study on End-to-End Speech Translation
要約 事前トレーニングと微調整は、エンドツーエンド音声翻訳 (E2E ST) に … 続きを読む