-
最近の投稿
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
- OrbitGrasp: $SE(3)$-Equivariant Grasp Learning
- M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
- Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment
- Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing
-
最近のコメント
表示できるコメントはありません。 cs.AI (28126) cs.CL (21249) cs.CR (2197) cs.CV (34799) cs.LG (32858) cs.RO (16174) cs.SY (2496) eess.IV (4244) eess.SY (2490) stat.ML (4401)
「cs.SD」カテゴリーアーカイブ
Lip2Vec: Efficient and Robust Visual Speech Recognition via Latent-to-Latent Visual to Audio Representation Mapping
要約 視覚音声認識 (VSR) は、人間の専門家であっても、ビデオ シーケンスに … 続きを読む
ML-SUPERB: Multilingual Speech Universal PERformance Benchmark
要約 音声処理ユニバーサル パフォーマンス ベンチマーク (SUPERB) は、 … 続きを読む
An Autoethnographic Exploration of XAI in Algorithmic Composition
要約 機械学習モデルは、民族音楽からクラシック音楽まで、さまざまなジャンルにわた … 続きを読む
Improving Joint Speech-Text Representations Without Alignment
要約 昨年は、テキストと画像のドメインが一緒に表現されるクロスモーダル表現空間の … 続きを読む
Deep Learning for Diverse Data Types Steganalysis: A Review
要約 ステガノグラフィーとステガナリシスは、情報セキュリティ分野の 2 つの相互 … 続きを読む
A Novel Self-training Approach for Low-resource Speech Recognition
要約 この論文では、低リソース設定における自動音声認識 (ASR) の自己学習ア … 続きを読む
EXPRESSO: A Benchmark and Analysis of Discrete Expressive Speech Resynthesis
要約 最近の研究では、テキストではなく、自己教師形式で学習された低ビットレートの … 続きを読む
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining
要約 オーディオ生成には、音声、音楽、効果音など、さまざまなタイプのオーディオに … 続きを読む
Intel Labs at Ego4D Challenge 2022: A Better Baseline for Audio-Visual Diarization
要約 このレポートでは、Ego4D Challenge 2022 のオーディオビ … 続きを読む
STHG: Spatial-Temporal Heterogeneous Graph Learning for Advanced Audio-Visual Diarization
要約 このレポートでは、Ego4D Challenge 2023 のオーディオビ … 続きを読む