-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.SD」カテゴリーアーカイブ
MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music
要約 急速に進化するマルチモーダル大規模言語モデル (LLM) では、音楽の理解 … 続きを読む
カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7
MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music はコメントを受け付けていません
Joint Multimodal Transformer for Emotion Recognition in the Wild
要約 マルチモーダル感情認識 (MMER) のシステムは、通常、視覚、テキスト、 … 続きを読む
TelME: Teacher-leading Multimodal Fusion Network for Emotion Recognition in Conversation
要約 会話中の感情認識 (ERC) は、対話システムがユーザーの要求に効果的に応 … 続きを読む
Voice Signal Processing for Machine Learning. The Case of Speaker Isolation
要約 自動音声アシスタントの普及とその他の最近の技術開発により、特に音声信号や人 … 続きを読む
Exploring Pathological Speech Quality Assessment with ASR-Powered Wav2Vec2 in Data-Scarce Context
要約 自動音声品質評価は、従来の知覚的臨床評価の代替またはサポートとしてさらに注 … 続きを読む
Emotion-Anchored Contrastive Learning Framework for Emotion Recognition in Conversation
要約 会話中の感情認識 (ERC) には、会話内の各発話の背後にある根底にある感 … 続きを読む
Phonetic Segmentation of the UCLA Phonetics Lab Archive
要約 音声技術と比較言語学の研究は、多様でアクセス可能な音声データへのアクセスに … 続きを読む
Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2
要約 SdSv チャレンジのタスク 2 は、最新のテキストに依存しない話者検証シ … 続きを読む
Siamese Vision Transformers are Scalable Audio-visual Learners
要約 従来のオーディオビジュアル手法は、独立したオーディオとビジュアルのバックボ … 続きを読む
Fusion approaches for emotion recognition from speech using acoustic and text-based features
要約 この論文では、音響およびテキストベースの特徴を使用して音声から感情を分類す … 続きを読む