-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Considerations for Ethical Speech Recognition Datasets
要約 タイトル:公正な音声認識データセットに関する考慮事項 要約: -音声AI技 … 続きを読む
M2-CTTS: End-to-End Multi-scale Multi-modal Conversational Text-to-Speech Synthesis
要約 【タイトル】 M2-CTTS: 多層多様な言語・音声モダリティに対応した会 … 続きを読む
Low-Resource Music Genre Classification with Cross-Modal Neural Model Reprogramming
要約 タイトル:「クロスモーダルニューラルモデル再プログラミングによる低リソース … 続きを読む
AV-SAM: Segment Anything Model Meets Audio-Visual Localization and Segmentation
要約 タイトル: AV-SAM: Segment Anything Model … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 タイトル:CryCeleb:乳児の泣き声に基づく話者認証データセット 要約 … 続きを読む
AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis
要約 タイトル:AQ-GT:時間的に整列し量子化されたGRU-Transform … 続きを読む
Going In Style: Audio Backdoors Through Stylistic Transformations
要約 タイトル:Going In Style: Audio Backdoors … 続きを読む
Lessons Learned in ATCO2: 5000 hours of Air Traffic Control Communications for Robust Automatic Speech Recognition and Understanding
要約 タイトル:ATCO2における学習成果:堅牢な自動音声認識と理解のための50 … 続きを読む
The Pipeline System of ASR and NLU with MLM-based Data Augmentation toward STOP Low-resource Challenge
要約 【タイトル】MLMベースのデータ拡張によるASRおよびNLUのパイプライン … 続きを読む
A Study on the Integration of Pipeline and E2E SLU systems for Spoken Semantic Parsing toward STOP Quality Challenge
要約 タイトル:STOP Quality Challengeのためのスポークンセ … 続きを読む