-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect
要約 チュニジアのアラビア方言の自動音声認識(ASR)システムの開発は、方言の言 … 続きを読む
Deep learning for music generation. Four approaches and their comparative evaluation
要約 本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成さ … 続きを読む
AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking
要約 屋内ドローンのローカリゼーションと追跡のためのユニークな技術である音響慣性 … 続きを読む
Chain of Correction for Full-text Speech Recognition with Large Language Models
要約 自動音声認識(ASR)のための大規模な言語モデル(LLMS)とのフルテキス … 続きを読む
Medical Spoken Named Entity Recognition
要約 話された名前の名前のエンティティ認識(NER)は、スピーチから名前のエンテ … 続きを読む
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions
要約 大規模な言語モデル(LLM)の最近の進歩は、さまざまなドメインに革命をもた … 続きを読む
Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment
要約 うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation
要約 音声品質評価では、通常、平均意見スコア(MOS)やスピーカーの類似性(SI … 続きを読む
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions
要約 このペーパーでは、自然言語の説明を活用することにより、音声品質評価に対する … 続きを読む
Continuous Speech Tokenizer in Text To Speech
要約 大規模な言語モデルの時代における言語と言語の融合は、大きな注目を集めていま … 続きを読む