-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
MusicAgent: An AI Agent for Music Understanding and Generation with Large Language Models
要約 AI を活用した音楽処理は、生成タスク (音色合成など) から理解タスク … 続きを読む
DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification
要約 データ拡張は、ディープ ニューラル ネットワーク (DNN) モデルの汎化 … 続きを読む
Analysis and Detection of Pathological Voice using Glottal Source Features
要約 音声の病状を自動検出することで、客観的な評価と早期の診断介入が可能になりま … 続きを読む
Wav2vec-based Detection and Severity Level Classification of Dysarthria from Speech
要約 音響音声信号から直接、構音障害を自動検出および重症度レベル分類することは、 … 続きを読む
The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation
要約 エンドツーエンドの音声言語理解 (SLU) は、テキストと音声に関する現在 … 続きを読む
Robust Wake-Up Word Detection by Two-stage Multi-resolution Ensembles
要約 音声ベースのインターフェイスは、ウェイクアップ ワード メカニズムに依存し … 続きを読む
LocSelect: Target Speaker Localization with an Auditory Selective Hearing Mechanism
要約 一般的な耐ノイズ性および耐残響性定位アルゴリズムは、主に、スピーカーのアイ … 続きを読む
LocSelect: Target Speaker Localization with an Auditory Selective Hearing Mechanism
要約 一般的な耐ノイズ性および耐残響性定位アルゴリズムは、主に、話者のアイデンテ … 続きを読む
AV-NeRF: Learning Neural Fields for Real-World Audio-Visual Scene Synthesis
要約 視聴覚シーンを記録する機械は、新しい位置や新しい視点で、現実的で一致する視 … 続きを読む