-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「cs.MM」カテゴリーアーカイブ
Few-shot Multimodal Sentiment Analysis based on Multimodal Probabilistic Fusion Prompts
要約 ソーシャルメディア上でのマルチモーダルコンテンツの急増により、マルチモーダ … 続きを読む
ZRIGF: An Innovative Multimodal Framework for Zero-Resource Image-Grounded Dialogue Generation
要約 画像ベースの対話システムは、視覚情報を統合することで大きな恩恵を受け、高品 … 続きを読む
Continual Multimodal Knowledge Graph Construction
要約 マルチモーダル ナレッジ グラフ構築 (MKGC) には、テキストや画像な … 続きを読む
SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection
要約 悪意のあるディープフェイクは、本物の顔と偽造された顔を区別することをめぐっ … 続きを読む
Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities
要約 顔、体、声などのマルチモーダルな手がかりを使った人物のクラスタリングは、映 … 続きを読む
SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering
要約 ビデオの質問と回答は、ビデオ理解の分野における基本的なタスクです。 Vid … 続きを読む
Contrastive Conditional Latent Diffusion for Audio-visual Segmentation
要約 我々は、オーディオの寄与を広範囲に調査するために、オーディオビジュアルセグ … 続きを読む
Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation
要約 栄養失調は、必須栄養素の不十分な摂取に起因し、重要な器官や身体機能全体に悪 … 続きを読む
DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation
要約 フューショット学習は、ベース データセットでトレーニングされたモデルを、モ … 続きを読む
Improving Social Media Popularity Prediction with Multiple Post Dependencies
要約 ソーシャル メディア人気予測は、レコメンデーション システムやマルチメディ … 続きを読む