-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
「eess.AS」カテゴリーアーカイブ
Non-Invasive Suicide Risk Prediction Through Speech Analysis
要約 救急部門での専門的な精神医学的評価と自殺傾向のリスクのある患者へのケアへの … 続きを読む
CTC-GMM: CTC guided modality matching for fast and accurate streaming speech translation
要約 ストリーミング音声翻訳 (ST) のモデルは、ソース言語の音声とターゲット … 続きを読む
Audio-Agent: Leveraging LLMs For Audio Generation, Editing and Composition
要約 テキストやビデオ入力に基づく音声生成、編集、作曲のためのマルチモーダルフレ … 続きを読む
SonicSense: Object Perception from In-Hand Acoustic Vibration
要約 SonicSenseを紹介する。SonicSenseは、ハードウェアとソフ … 続きを読む
Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models
要約 げっ歯類は、社会的コミュニケーションのために広範囲の超音波発声 (USV) … 続きを読む
Active Listener: Continuous Generation of Listener’s Head Motion Response in Dyadic Interactions
要約 二項音声対話の重要な要素は、対話者の発話に対する聞き手の反応を反映する頭の … 続きを読む
AfriHuBERT: A self-supervised speech representation model for African languages
要約 この研究では、もともと 147 の言語で事前トレーニングされた、最先端 ( … 続きを読む
Alignment-Free Training for Transducer-based Multi-Talker ASR
要約 RNN トランスデューサ (RNNT) を拡張して複数話者の音声を認識する … 続きを読む
Boosting Hybrid Autoregressive Transducer-based ASR with Internal Acoustic Model Training and Dual Blank Thresholding
要約 ハイブリッド自己回帰トランスデューサー (HAT) は、ブランク事後分布と … 続きを読む
Word-wise intonation model for cross-language TTS systems
要約 この論文では、ロシア語の単語ごとのイントネーション モデルを提案し、それを … 続きを読む