-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Late multimodal fusion for image and audio music transcription
要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む
Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds
要約 視聴覚ナビゲーションは、視覚と聴覚を組み合わせて、マッピングされていない環 … 続きを読む
Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data
要約 本稿では、音声発話と対応する画像によって表される感情を離散クラスに分類する … 続きを読む
In-Air Imaging Sonar Sensor Network with Real-Time Processing Using GPUs
要約 自律航法やロボットへの応用では、環境を正しく感知することが重要です。 この … 続きを読む
StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation
要約 StyleTalker は、正確にオーディオ同期された唇の形、リアルな頭の … 続きを読む
Everything at Once — Multi-modal Fusion Transformer for Video Retrieval
要約 ビデオ データからのマルチモーダル学習は、ゼロ ショット検索や分類などのタ … 続きを読む
Exploiting Transformation Invariance and Equivariance for Self-supervised Sound Localisation
要約 ビデオの音源をローカライズするために、オーディオビジュアル表現学習のための … 続きを読む
Hybrid Multimodal Feature Extraction, Mining and Fusion for Sentiment Analysis
要約 このホワイト ペーパーでは、MuSe-Humor、MuSe-Reactio … 続きを読む
Late multimodal fusion for image and audio music transcription
要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む
An Intensity and Phase Stacked Analysis of Phase-OTDR System using Deep Transfer Learning and Recurrent Neural Networks
要約 分散型音響センサ(DAS)は、光ファイバに沿って様々な事象の信号を非常に高 … 続きを読む