-
最近の投稿
- How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework
- NavEX: A Multi-Agent Coverage in Non-Convex and Uneven Environments via Exemplar-Clustering
- Simultaneous System Identification and Model Predictive Control with No Dynamic Regret
- When to Localize? A Risk-Constrained Reinforcement Learning Approach
- SPARK-Remote: A Cost-Effective System for Remote Bimanual Robot Teleoperation
-
最近のコメント
表示できるコメントはありません。 cs.AI (37393) cs.CL (28290) cs.CV (43079) cs.HC (2862) cs.LG (42313) cs.RO (22180) cs.SY (3395) eess.IV (5005) eess.SY (3387) stat.ML (5527)
「cs.MM」カテゴリーアーカイブ
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む
Frieren: Efficient Video-to-Audio Generation with Rectified Flow Matching
要約 ビデオ – オーディオ (V2A) 生成は、サイレント ビデオ … 続きを読む
Resolving Sentiment Discrepancy for Multimodal Sentiment Detection via Semantics Completion and Decomposition
要約 近年のソーシャル メディア投稿の急増に伴い、マルチモーダル (画像とテキス … 続きを読む
Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack
要約 オンライン ポータルを通じて合成開口レーダー (SAR) 画像に幅広くアク … 続きを読む
Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは人間の社会的行動、感情、認知の重要な要素です。 その自動理解によ … 続きを読む
MERGE — A Bimodal Dataset for Static Music Emotion Recognition
要約 音楽感情認識 (MER) 分野は、特徴エンジニアリング、機械学習、深層学習 … 続きを読む
Pseudo-triplet Guided Few-shot Composed Image Retrieval
要約 合成画像検索 (CIR) は、マルチモーダル クエリ (参照画像とそれに対 … 続きを読む
EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture
要約 本稿では、トランスフォーマ・アーキテクチャのパワーを活用し、高性能な成果を … 続きを読む
VCoME: Verbal Video Composition with Multimodal Editing Effects
要約 ボイスオーバーやテキストオーバーレイを特徴とする言葉によるビデオは、価値あ … 続きを読む