-
最近の投稿
- Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles
- Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation
- Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows
- Enhancing Scene Coordinate Regression with Efficient Keypoint Detection and Sequential Information
- Constrained Factor Graph Optimization for Robust Networked Pedestrian Inertial Navigation
-
最近のコメント
表示できるコメントはありません。 cs.AI (38035) cs.CL (28747) cs.CV (43624) cs.HC (2908) cs.LG (42962) cs.RO (22623) cs.SY (3469) eess.IV (5057) eess.SY (3461) stat.ML (5597)
「cs.MM」カテゴリーアーカイブ
A Comprehensive Survey of Knowledge-Based Vision Question Answering Systems: The Lifecycle of Knowledge in Visual Reasoning Task
要約 知識ベースのビジョン質問応答(KB-VQA)は、視覚的およびテキストの入力 … 続きを読む
FMNV: A Dataset of Media-Published News Videos for Fake News Detection
要約 ニュースメディア、特にビデオベースのプラットフォームは、日常生活に深く組み … 続きを読む
CasualHDRSplat: Robust High Dynamic Range 3D Gaussian Splatting from Casually Captured Videos
要約 最近、ニューラル放射輝度フィールド(NERF)や3Dガウスのスプラッティン … 続きを読む
TCAN: Text-oriented Cross Attention Network for Multimodal Sentiment Analysis
要約 マルチモーダル感情分析(MSA)は、言語、視覚、音響のモダリティを活用する … 続きを読む
AudioX: Diffusion Transformer for Anything-to-Audio Generation
要約 オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む
4D Multimodal Co-attention Fusion Network with Latent Contrastive Alignment for Alzheimer’s Diagnosis
要約 マルチモーダルニューロイメージングは、人間の脳組織と疾患関連のダイナミ … 続きを読む
VLM as Policy: Common-Law Content Moderation Framework for Short Video Platform
要約 指数関数的に成長する短いビデオプラットフォーム(SVP)は、特に未成年者に … 続きを読む
Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
要約 人間のビデオから操作タスクを実行することを学ぶことは、ロボットを教えるため … 続きを読む
SemCORE: A Semantic-Enhanced Generative Cross-Modal Retrieval Framework with MLLMs
要約 クロスモーダル検索(CMR)は、マルチメディア研究の基本的なタスクであり、 … 続きを読む
HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation
要約 シーンレベルの3D世代は、マルチメディアとコンピューターグラフィックスの重 … 続きを読む