-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
General-purpose, long-context autoregressive modeling with Perceiver AR
要約 実世界のデータは高次元です。本、画像、または音楽のパフォーマンスには、圧縮 … 続きを読む
Learning Speaker-specific Lip-to-Speech Generation
要約 唇の動きを理解し、それからスピーチを推測することは、一般の人にとって悪名高 … 続きを読む
M2FNet: Multi-modal Fusion Network for Emotion Recognition in Conversation
要約 会話における感情認識(ERC)は、交感神経の人間と機械の相互作用を発達させ … 続きを読む
Canonical Cortical Graph Neural Networks and its Application for Speech Enhancement in Future Audio-Visual Hearing Aids
要約 近年の機械学習アルゴリズムの成功にもかかわらず、これらのモデルの多くは、マ … 続きを読む
FedNST: Federated Noisy Student Training for Automatic Speech Recognition
要約 Federated Learning (FL) は、分散システムにおいて、 … 続きを読む
Few-Shot Audio-Visual Learning of Environment Acoustics
要約 ルームインパルス応答(RIR)関数は、周囲の物理環境がリスナーに聞こえる音 … 続きを読む
Face-Dubbing++: Lip-Synchronous, Voice Preserving Translation of Videos
要約 本論文では、映像の音声保存、リップシンクロ翻訳のためのニューラルエンドツー … 続きを読む