-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Deepfake audio detection by speaker verification
要約 最近の深層学習の進歩のおかげで、今日では非常にリアルな合成音声を生成する高 … 続きを読む
Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは、人間の感情と認識の重要な要素です。 その自動理解は、より自然な … 続きを読む
Multi-encoder attention-based architectures for sound recognition with partial visual assistance
要約 大規模な音声認識データ セットは通常、マルチメディア ライブラリから取得し … 続きを読む
AutoLV: Automatic Lecture Video Generator
要約 注釈付きスライド、講師の参照音声、講師の参照ポートレート ビデオから直接、 … 続きを読む
Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video
要約 オーディオビジュアル自動音声認識 (AV-ASR) は、追加の情報源として … 続きを読む
Binaural Signal Representations for Joint Sound Event Detection and Acoustic Scene Classification
要約 サウンド イベント検出 (SED) と音響シーン分類 (ASC) は、音響 … 続きを読む
Estimating Visual Information From Audio Through Manifold Learning
要約 オーディオ信号のみを使用してシーンに関する視覚情報を抽出するための新しいフ … 続きを読む
Learning Audio-Visual embedding for Wild Person Verification
要約 これらの 2 つのモダリティからオーディオビジュアル埋め込みを抽出して、人 … 続きを読む
Video-Guided Curriculum Learning for Spoken Video Grounding
要約 このホワイト ペーパーでは、新しいタスクである音声ビデオ グラウンディング … 続きを読む