-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
ReZero: Region-customizable Sound Extraction
要約 マルチチャネル領域ごとのサウンド抽出 (R-SE) タスク用の一般的で柔軟 … 続きを読む
Diffiner: A Versatile Diffusion-based Generative Refiner for Speech Enhancement
要約 ディープ ニューラル ネットワーク (DNN) ベースの音声強調 (SE) … 続きを読む
LLaSM: Large Language and Speech Model
要約 マルチモーダル大規模言語モデルは、最近大きな関心を集めています。 ただし、 … 続きを読む
What You Hear Is What You See: Audio Quality Metrics From Image Quality Metrics
要約 この研究では、オーディオ信号をスペクトログラムとして表すことにより、オーデ … 続きを読む
Investigating Reproducibility at Interspeech Conferences: A Longitudinal and Comparative Perspective
要約 再現性は、分野を超えた科学の進歩にとって重要な側面であり、オープン サイエ … 続きを読む
a unified front-end framework for english text-to-speech synthesis
要約 フロントエンドは英語音声合成 (TTS) システムの重要なコンポーネントで … 続きを読む
Killing two birds with one stone: Can an audio captioning system also be used for audio-text retrieval?
要約 自動音声キャプション (AAC) は、テキスト文を使用して音声録音を説明で … 続きを読む
OLISIA: a Cascade System for Spoken Dialogue State Tracking
要約 Dialogue State Tracking (DST) は音声対話シス … 続きを読む
Let There Be Sound: Reconstructing High Quality Speech from Silent Videos
要約 この研究の目標は、唇の動きだけから高品質の音声を再構築することであり、この … 続きを読む