-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Hybrid Multimodal Feature Extraction, Mining and Fusion for Sentiment Analysis
要約 本論文では,MuSe-Humor, MuSe-Reaction, MuSe … 続きを読む
ECLIPSE: Efficient Long-range Video Retrieval using Sight and Sound
要約 テキストからビデオへの長距離検索のためのオーディオビジュアル手法を紹介しま … 続きを読む
Towards Unconstrained Audio Splicing Detection and Localization with Neural Networks
要約 無料で利用できる使いやすいオーディオ編集ツールを使用すると、オーディオのス … 続きを読む
End-To-End Audiovisual Feature Fusion for Active Speaker Detection
要約 アクティブスピーカー検出は、人間と機械の相互作用において重要な役割を果たし … 続きを読む
VoViT: Low Latency Graph-based Audio-Visual Voice Separation Transformer
要約 このホワイトペーパーでは、音声と歌声の2つのシナリオで、低遅延で最先端の結 … 続きを読む
Quantized GAN for Complex Music Generation from Dance Videos
要約 Dance2Music-GAN(D2M-GAN)は、ダンスビデオを条件とし … 続きを読む
Position Prediction as an Effective Pretraining Strategy
要約 トランスフォーマーは、その強力な表現能力により、自然言語処理(NLP)、コ … 続きを読む
A Single Self-Supervised Model for Many Speech Modalities Enables Zero-Shot Modality Transfer
要約 視聴覚音声モデルは、音声のみのモデルと比較して優れたパフォーマンスと堅牢性 … 続きを読む
Audio-Visual Segmentation
要約 視聴覚セグメンテーション(AVS)と呼ばれる新しい問題を調査することを提案 … 続きを読む