-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
AudioFormer: Audio Transformer learns audio feature representations from discrete acoustic codes
要約 我々は、AudioFormer という名前のメソッドを提案します。このメソ … 続きを読む
How to Estimate Model Transferability of Pre-Trained Speech Models?
要約 この研究では、ターゲット タスクを微調整するための事前トレーニング済み音声 … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 この論文では、幼児の泣き声のラベル付きコレクションである Ubenwa C … 続きを読む
SpeechGen: Unlocking the Generative Power of Speech Language Models with Prompts
要約 大規模言語モデル (LLM) は、特に ChatGPT の出現により、人工 … 続きを読む
Exploiting Diverse Feature for Multimodal Sentiment Analysis
要約 このペーパーでは、MuSe 2023 マルチモーダル感情分析チャレンジの … 続きを読む
Towards Automated Animal Density Estimation with Acoustic Spatial Capture-Recapture
要約 受動的音響モニタリングは、音響的には活動的だが視覚的に調査するのが難しい野 … 続きを読む
MultiPA: a multi-task speech pronunciation assessment system for a closed and open response scenario
要約 自動音声発音評価の設計は、クローズド応答シナリオとオープン応答シナリオに分 … 続きを読む
Real-time Detection of AI-Generated Speech for DeepFake Voice Conversion
要約 音声のクローン作成や、ある個人から別の個人へのリアルタイムの音声変換を可能 … 続きを読む
WavMark: Watermarking for Audio Generation
要約 ゼロショット音声合成における最近の進歩により、高レベルのリアリズムを維持し … 続きを読む
AudioFormer: Audio Transformer learns audio feature representations from discrete acoustic codes
要約 我々は、AudioFormer という名前のメソッドを提案します。このメソ … 続きを読む