-
最近の投稿
- High-Dimensional Independence Testing via Maximum and Average Distance Correlations
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44172) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5744)
「eess.AS」カテゴリーアーカイブ
MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation
要約 医療分野における多言語音声翻訳(ST)は、言語の壁を越えた効率的なコミュニ … 続きを読む
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant
要約 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声とテキス … 続きを読む
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant
要約 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、音声とテキス … 続きを読む
LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect
要約 チュニジアのアラビア方言の自動音声認識(ASR)システムの開発は、方言の言 … 続きを読む
Deep learning for music generation. Four approaches and their comparative evaluation
要約 本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成さ … 続きを読む
AIM: Acoustic Inertial Measurement for Indoor Drone Localization and Tracking
要約 屋内ドローンのローカリゼーションと追跡のためのユニークな技術である音響慣性 … 続きを読む
Chain of Correction for Full-text Speech Recognition with Large Language Models
要約 自動音声認識(ASR)のための大規模な言語モデル(LLMS)とのフルテキス … 続きを読む
Medical Spoken Named Entity Recognition
要約 話された名前の名前のエンティティ認識(NER)は、スピーチから名前のエンテ … 続きを読む
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions
要約 大規模な言語モデル(LLM)の最近の進歩は、さまざまなドメインに革命をもた … 続きを読む
Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment
要約 うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む