-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「cs.MM」カテゴリーアーカイブ
IVAC-P2L: Leveraging Irregular Repetition Priors for Improving Video Action Counting
要約 ビデオ アクション カウンティング (VAC) は、ビデオ内の反復アクショ … 続きを読む
DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance
要約 振付師はダンスがどのようなものかを決定し、カメラマンはダンスの最終的なプレ … 続きを読む
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar
要約 人間の意図に基づく水路の認識は、水環境における無人水上車両 (USV) の … 続きを読む
Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation
要約 この論文では、第 6 回野生感情行動分析 (ABAW) コンペティションの … 続きを読む
Mixture-of-Prompt-Experts for Multi-modal Semantic Understanding
要約 単なる表面的なコンテンツ関係マイニングを超えた、マルチモーダルな意味論的な … 続きを読む
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation
要約 音楽生成ダンスの研究は、斬新かつ挑戦的なイメージ生成タスクです。 音楽とシ … 続きを読む
K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling
要約 歌詞の翻訳は、1 世紀以上にわたって研究されてきた分野であり、現在、計算言 … 続きを読む
M&M: Multimodal-Multitask Model Integrating Audiovisual Cues in Cognitive Load Assessment
要約 この論文では、認知負荷評価 (CLA) 用の AVCAffe データセット … 続きを読む
GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む