-
最近の投稿
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
- Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44171) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5743)
「eess.AS」カテゴリーアーカイブ
Fine-tuning Whisper on Low-Resource Languages for Real-World Applications
要約 このペーパーでは、Swissドイツ語をケーススタディとして使用して、文レベ … 続きを読む
Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis
要約 このホワイトペーパーでは、オーディオデータとビデオデータの両方を活用して、 … 続きを読む
MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders
要約 大規模な言語モデル(LLMS)の急速な進歩は、自然言語処理能力を大幅に強化 … 続きを読む
Testing LLMs’ Capabilities in Annotating Translations Based on an Error Typology Designed for LSP Translation: First Experiments with ChatGPT
要約 この研究では、エラーの類型に基づいてMT出力に注釈を付ける際に、大規模な言 … 続きを読む
Collective Learning Mechanism based Optimal Transport Generative Adversarial Network for Non-parallel Voice Conversion
要約 画像合成に大きな成功を示した後、生成敵対的ネットワーク(GAN)モデルは同 … 続きを読む
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting
要約 人間のスピーチは、情報の単なる転送を超えています。 それは感情の深いやり取 … 続きを読む
EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting
要約 人間のスピーチは、情報の単なる転送を超えています。 それは感情の深いやり取 … 続きを読む
A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition
要約 水中音響ターゲット認識(UATR)は、海洋の多様性と国防の安全を保護するた … 続きを読む
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
要約 Sift(音声指導の微調整)、音声テキスト大規模言語モデル(LLM)の指示 … 続きを読む