-
最近の投稿
- Geofenced Unmanned Aerial Robotic Defender for Deer Detection and Deterrence (GUARD)
- mmMirror: Device Free mmWave Indoor NLoS Localization Using Van-Atta-Array IRS
- Fast and Robust Localization for Humanoid Soccer Robot via Iterative Landmark Matching
- Robust 2D lidar-based SLAM in arboreal environments without IMU/GNSS
- REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?
-
最近のコメント
表示できるコメントはありません。 cs.AI (38249) cs.CL (28902) cs.CV (43799) cs.HC (2925) cs.LG (43179) cs.RO (22772) cs.SY (3498) eess.IV (5073) eess.SY (3490) stat.ML (5619)
「cs.SD」カテゴリーアーカイブ
Spectral oversubtraction? An approach for speech enhancement after robot ego speech filtering in semi-real-time
要約 スペクトル減算は、その単純さから広く使用されており、ロボットの発話時のシン … 続きを読む
Soft Acoustic Curvature Sensor: Design and Development
要約 この論文では、新しい Soft Acoustic Curvature (S … 続きを読む
Human-mimetic binaural ear design and sound source direction estimation for task realization of musculoskeletal humanoids
要約 筋骨格ヒューマノイドによる人間に似た環境認識は、実際の複雑な環境でのタスク … 続きを読む
Advancing Topic Segmentation of Broadcasted Speech with Multilingual Semantic Embeddings
要約 音声ベースのトピック セグメンテーションの最近の進歩により、事前トレーニン … 続きを読む
Enhancing Temporal Understanding in Audio Question Answering for Large Audio Language Models
要約 音声質問応答タスクには、音声イベント分類、音声キャプション、およびオープン … 続きを読む
SpeechTaxi: On Multilingual Semantic Speech Classification
要約 多言語音声符号化および文字起こしにおける最近の進歩により、意味論的音声分類 … 続きを読む
LAST: Language Model Aware Speech Tokenization
要約 音声トークン化は音声言語モデル (LM) の基礎として機能し、音声言語モデ … 続きを読む
Sortformer: Seamless Integration of Speaker Diarization and ASR by Bridging Timestamps and Tokens
要約 私たちは、既存のエンドツーエンドのダイアライゼーション モデルと比較して型 … 続きを読む
An Effective Context-Balanced Adaptation Approach for Long-Tailed Speech Recognition
要約 エンドツーエンド (E2E) 自動音声認識 (ASR) モデルは、さまざま … 続きを読む
MuPT: A Generative Symbolic Music Pretrained Transformer
要約 この論文では、音楽の事前トレーニングへの大規模言語モデル (LLM) の適 … 続きを読む