-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「eess.AS」カテゴリーアーカイブ
Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation
要約 この論文では、第 6 回野生感情行動分析 (ABAW) コンペティションの … 続きを読む
LeBenchmark 2.0: a Standardized, Replicable and Enhanced Framework for Self-supervised Representations of French Speech
要約 自己教師あり学習 (SSL) は、コンピューター ビジョンや自然言語処理な … 続きを読む
Generalized Multi-Source Inference for Text Conditioned Music Diffusion Models
要約 マルチソース拡散モデル (MSDM) を使用すると、一貫したソースのセット … 続きを読む
A low latency attention module for streaming self-supervised speech representation learning
要約 トランスフォーマーは深層学習の基本的な構成要素であり、アテンション メカニ … 続きを読む
SpeechDPR: End-to-End Spoken Passage Retrieval for Open-Domain Spoken Question Answering
要約 音声質問応答 (SQA) は、マシンが特定の音声パッセージ内の回答範囲を見 … 続きを読む
Zero Resource Code-switched Speech Benchmark Using Speech Utterance Pairs For Multiple Spoken Languages
要約 自己監視型音声エンコーダのコードスイッチング機能を直接評価するために設計さ … 続きを読む
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation
要約 音楽生成ダンスの研究は、斬新かつ挑戦的なイメージ生成タスクです。 音楽とシ … 続きを読む
BirdSet: A Multi-Task Benchmark for Classification in Avian Bioacoustics
要約 ディープラーニング (DL) モデルは、環境の健全性と生物多様性を診断する … 続きを読む
Joint Multimodal Transformer for Dimensional Emotional Recognition in the Wild
要約 ビデオにおける視聴覚感情認識 (ER) には、単峰性のパフォーマンスに比べ … 続きを読む
Lodge: A Coarse to Fine Diffusion Network for Long Dance Generation Guided by the Characteristic Dance Primitives
要約 私たちは、与えられた音楽に基づいて非常に長いダンス シーケンスを生成できる … 続きを読む