-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Testing LLMs’ Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT
要約 この研究では、エラーの類型に基づいてMT出力に注釈を付ける際に、大規模な言 … 続きを読む
Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion
要約 画像合成に大きな成功を示した後、生成敵対的ネットワーク(GAN)モデルは同 … 続きを読む
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting
要約 人間のスピーチは、情報の単なる転送を超えています。 それは感情の深いやり取 … 続きを読む
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting
要約 人間のスピーチは、情報の単なる転送を超えています。 それは感情の深いやり取 … 続きを読む
A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition
要約 水中音響ターゲット認識(UATR)は、海洋の多様性と国防の安全を保護するた … 続きを読む
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
要約 Sift(音声指導の微調整)、音声テキスト大規模言語モデル(LLM)の指示 … 続きを読む
Dysarthria Normalization via Local Lie Group Transformations for Robust ASR
要約 スペクトログラムのローカルリーグループ変換を使用して、ダイサルトリック音声 … 続きを読む
Taming Data and Transformers for Audio Generation
要約 アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む
Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning
要約 喘息は、世界中の何百万人もの人々に影響を与える慢性呼吸条件です。 この状態 … 続きを読む
SpoofCeleb: Speech Deepfake Detection and SASV In The Wild
要約 このペーパーでは、音声ディープファーク検出(SDD)およびスプーフィングの … 続きを読む