-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「cs.SD」カテゴリーアーカイブ
Multilingual acoustic word embeddings for zero-resource languages
要約 この研究は、ラベル付きデータのないゼロリソース言語向けの音声アプリケーショ … 続きを読む
Attentive Fusion: A Transformer-based Approach to Multimodal Hate Speech Detection
要約 最近のソーシャル メディアの使用量の急増と急激な増加に伴い、ソーシャル メ … 続きを読む
Developing an AI-based Integrated System for Bee Health Evaluation
要約 ミツバチは世界の食料供給量の約3分の1を受粉しているが、農薬や害虫などのい … 続きを読む
On the Audio Hallucinations in Large Audio-Video Language Models
要約 大規模なオーディオビデオ言語モデルは、ビデオとオーディオの両方の説明を生成 … 続きを読む
Communication-Efficient Personalized Federated Learning for Speech-to-Text Tasks
要約 プライバシーを保護し、法的規制を満たすために、自動音声認識 (ASR) や … 続きを読む
Attention-Based Recurrent Neural Network For Automatic Behavior Laying Hen Recognition
要約 現代の養鶏の関心の 1 つは、健康行動に関する非常に有益な情報を含む産卵鶏 … 続きを読む
ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech Recognition Challenge
要約 運転シナリオにおける音声処理と認識の研究を促進するために、私たちは ISC … 続きを読む
RTFS-Net: Recurrent time-frequency modelling for efficient audio-visual speech separation
要約 視聴覚音声分離手法は、さまざまなモダリティを統合して高品質の分離音声を生成 … 続きを読む
Using i-vectors for subject-independent cross-session EEG transfer learning
要約 認知負荷分類は、脳波検査 (EEG) などの生理学的測定に基づいて、タスク … 続きを読む