-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Re-Parameterization of Lightweight Transformer for On-Device Speech Emotion Recognition
要約 エッジまたはモノのインターネット (IoT) デバイスでの機械学習モデルの … 続きを読む
A Comparative Study of Discrete Speech Tokens for Semantic-Related Tasks with Large Language Models
要約 Speech Large Language Model (Speech L … 続きを読む
Investigating the Effectiveness of Explainability Methods in Parkinson’s Detection from Speech
要約 パーキンソン病 (PD) における言語障害は、診断の重要な初期指標となりま … 続きを読む
Investigating the Effectiveness of Explainability Methods in Parkinson’s Detection from Speech
要約 パーキンソン病 (PD) における言語障害は、診断の重要な初期指標となりま … 続きを読む
SAV-SE: Scene-aware Audio-Visual Speech Enhancement with Selective State Space Model
要約 音声強調はさまざまなアプリケーションで重要な役割を果たしており、視覚情報の … 続きを読む
Diffusion Models for Audio Restoration
要約 オーディオ再生デバイスの発展と高速データ伝送に伴い、エンターテインメントと … 続きを読む
Electroencephalogram-based Multi-class Decoding of Attended Speakers’ Direction with Audio Spatial Spectrum
要約 聴取者の脳波 (EEG) 信号から聴取者の焦点の指向性を解読することは、聴 … 続きを読む
Building a Taiwanese Mandarin Spoken Language Model: A First Attempt
要約 この技術レポートでは、台湾華語の音声大規模言語モデル (LLM) を構築す … 続きを読む
NatureLM-audio: an Audio-Language Foundation Model for Bioacoustics
要約 テキストと音声で促される大規模言語モデル (LLM) は、スピーチ、音楽、 … 続きを読む