-
最近の投稿
- Interação entre robôs humanoides: desenvolvendo a colaboração e comunicação autônoma
- Estimating the Spectral Moments of the Kernel Integral Operator from Finite Sample Matrices
- PnLCalib: Sports Field Registration via Points and Lines Optimization
- Understanding When Tree of Thoughts Succeeds: Larger Models Excel in Generation, Not Discrimination
- Cross-Category Functional Grasp Transfer
-
最近のコメント
表示できるコメントはありません。 cs.AI (28535) cs.CL (21571) cs.CR (2228) cs.CV (35152) cs.LG (33296) cs.RO (16472) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4466)
「eess.AS」カテゴリーアーカイブ
Effectiveness of Text, Acoustic, and Lattice-based representations in Spoken Language Understanding tasks
要約 このホワイト ペーパーでは、音声言語理解 (SLU) セットアップにおける … 続きを読む
Analysing Diffusion-based Generative Approaches versus Discriminative Approaches for Speech Restoration
要約 拡散ベースの生成モデルは、ここ数年、コンピューター ビジョンと音声処理のコ … 続きを読む
Trustera: A Live Conversation Redaction System
要約 Trustera は、リアルタイムの会話で個人を特定できる情報 (PII) … 続きを読む
Analyzing Acoustic Word Embeddings from Pre-trained Self-supervised Speech Models
要約 さまざまなタスクでの自己教師ありモデルの強力な結果を考えると、可変長の話し … 続きを読む
End-to-end Spoken Language Understanding with Tree-constrained Pointer Generator
要約 エンド ツー エンドの音声言語理解 (SLU) には、ロングテール ワード … 続きを読む
Chat with the Environment: Interactive Multimodal Perception using Large Language Models
要約 複雑な世界でロボットの動作をプログラミングするには、器用な低レベルのスキル … 続きを読む
Cross-speaker Emotion Transfer by Manipulating Speech Style Latents
要約 近年、感情的なテキスト読み上げはかなりの進歩を遂げています。 ただし、大量 … 続きを読む
Once-for-All Sequence Compression for Self-Supervised Speech Models
要約 時間軸に沿ったシーケンスの長さは、多くの場合、音声処理における計算の支配的 … 続きを読む
Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech
要約 この論文では、テキスト音声合成 (TTS) モデルのための大規模な多言語音 … 続きを読む
Cascading and Direct Approaches to Unsupervised Constituency Parsing on Spoken Sentences
要約 教師なし構文解析に関する過去の作業は、記述された形式に限定されています。 … 続きを読む