-
最近の投稿
- Lasso Gripper: A String Shooting-Retracting Mechanism for Shape-Adaptive Grasping
- TACS-Graphs: Traversability-Aware Consistent Scene Graphs for Ground Robot Indoor Localization and Mapping
- Non-Overlap-Aware Egocentric Pose Estimation for Collaborative Perception in Connected Autonomy
- Hard Contacts with Soft Gradients: Refining Differentiable Simulators for Learning and Control
- AMPLIFY: Actionless Motion Priors for Robot Learning from Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (39812) cs.CL (30135) cs.CV (45122) cs.HC (3045) cs.LG (44743) cs.RO (23829) cs.SY (3627) eess.IV (5166) eess.SY (3619) stat.ML (5821)
「eess.AS」カテゴリーアーカイブ
Zero-shot Musical Stem Retrieval with Joint-Embedding Predictive Architectures
要約 この論文では、音楽幹の検索のタスクに取り組みます。 音楽ミックスが与えられ … 続きを読む
Scaling Transformers for Low-Bitrate High-Quality Speech Coding
要約 ニューラル オーディオ コーデック モデルを使用した音声のトークン化は、単 … 続きを読む
Multiple Choice Learning for Efficient Speech Separation with Many Speakers
要約 教師付き設定で音声分離モデルをトレーニングすると、モデルの予測とグラウンド … 続きを読む
How to Learn a New Language? An Efficient Solution for Self-Supervised Learning Models Unseen Languages Adaption in Low-Resource Scenario
要約 音声の自己教師あり学習 (SSL) モデルを利用すると、自動音声認識 (A … 続きを読む
Codec Does Matter: Exploring the Semantic Shortcoming of Codec for Audio Language Model
要約 オーディオ生成における最近の進歩は、大規模言語モデル (LLM) の機能に … 続きを読む
Inter-linguistic Phonetic Composition (IPC): A Theoretical and Computational Approach to Enhance Second Language Pronunciation
要約 第 2 言語 (L2) の学習者は、L2 の母語話者がこれらの音を別個で交 … 続きを読む
A Suite for Acoustic Language Model Evaluation
要約 音声言語モデルは最近、汎用音声処理システムとして大きな可能性を示しています … 続きを読む
Continual Learning in Machine Speech Chain Using Gradient Episodic Memory
要約 自動音声認識 (ASR) システムの継続的な学習には、特に以前に学習したタ … 続きを読む
AMPS: ASR with Multimodal Paraphrase Supervision
要約 自発的または会話的な多言語音声は、最先端の自動音声認識 (ASR) システ … 続きを読む