-
最近の投稿
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
- Information-Driven Search and Track of Novel Space Objects
- Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34429) cs.LG (32448) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「eess.AS」カテゴリーアーカイブ
Automatic Equalization for Individual Instrument Tracks Using Convolutional Neural Networks
要約 個々の楽器トラックの自動イコライゼーションのための新しいアプローチを提案し … 続きを読む
Evolutionary Prompt Design for LLM-Based Post-ASR Error Correction
要約 最新の大規模言語モデル (LLM) の強みを基盤として、生成的誤り訂正 ( … 続きを読む
Towards scalable efficient on-device ASR with transfer learning
要約 転移学習の多言語事前トレーニングにより、低リソースの単言語 ASR モデル … 続きを読む
Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning
要約 テキストから音楽へのモデルを使用すると、ユーザーはテキスト コマンドを使用 … 続きを読む
Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization
要約 最近、新しい形式の音声部分偽造がフォレンジックに課題をもたらしており、長時 … 続きを読む
Generating Sample-Based Musical Instruments Using Neural Audio Codec Language Models
要約 この論文では、テキストまたは参照音声プロンプトに基づいてサンプルベースの楽 … 続きを読む
Robustness of Speech Separation Models for Similar-pitch Speakers
要約 シングルチャネル音声分離は、マルチスピーカー環境で音声認識システムを強化す … 続きを読む
TTSDS — Text-to-Speech Distribution Score
要約 最近公開された Text-to-Speech (TTS) システムの多くは … 続きを読む
Cross-Speaker Encoding Network for Multi-Talker Speech Recognition
要約 エンドツーエンドのマルチ話者音声認識は、複数の話者からの重複した音声を直接 … 続きを読む
J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling
要約 音声対話は人間と AI の対話において重要な役割を果たしており、対話指向の … 続きを読む