-
最近の投稿
- Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles
- Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation
- Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows
- Enhancing Scene Coordinate Regression with Efficient Keypoint Detection and Sequential Information
- Constrained Factor Graph Optimization for Robust Networked Pedestrian Inertial Navigation
-
最近のコメント
表示できるコメントはありません。 cs.AI (38035) cs.CL (28747) cs.CV (43624) cs.HC (2908) cs.LG (42962) cs.RO (22623) cs.SY (3469) eess.IV (5057) eess.SY (3461) stat.ML (5597)
「cs.MM」カテゴリーアーカイブ
IVAC-P2L: Leveraging Irregular Repetition Priors for Improving Video Action Counting
要約 ビデオ アクション カウンティング (VAC) は、ビデオ内の反復アクショ … 続きを読む
DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance
要約 振付師はダンスがどのようなものかを決定し、カメラマンはダンスの最終的なプレ … 続きを読む
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar
要約 人間の意図に基づく水路の認識は、水環境における無人水上車両 (USV) の … 続きを読む
Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation
要約 この論文では、第 6 回野生感情行動分析 (ABAW) コンペティションの … 続きを読む
Mixture-of-Prompt-Experts for Multi-modal Semantic Understanding
要約 単なる表面的なコンテンツ関係マイニングを超えた、マルチモーダルな意味論的な … 続きを読む
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation
要約 音楽生成ダンスの研究は、斬新かつ挑戦的なイメージ生成タスクです。 音楽とシ … 続きを読む
K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling
要約 歌詞の翻訳は、1 世紀以上にわたって研究されてきた分野であり、現在、計算言 … 続きを読む
M&M: Multimodal-Multitask Model Integrating Audiovisual Cues in Cognitive Load Assessment
要約 この論文では、認知負荷評価 (CLA) 用の AVCAffe データセット … 続きを読む
GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む