-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection
要約 悪意のあるディープフェイクは、本物の顔と偽造された顔を区別することをめぐっ … 続きを読む
Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities
要約 顔、体、声などのマルチモーダルな手がかりを使った人物のクラスタリングは、映 … 続きを読む
SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering
要約 ビデオの質問と回答は、ビデオ理解の分野における基本的なタスクです。 Vid … 続きを読む
Contrastive Conditional Latent Diffusion for Audio-visual Segmentation
要約 我々は、オーディオの寄与を広範囲に調査するために、オーディオビジュアルセグ … 続きを読む
Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation
要約 栄養失調は、必須栄養素の不十分な摂取に起因し、重要な器官や身体機能全体に悪 … 続きを読む
DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation
要約 フューショット学習は、ベース データセットでトレーニングされたモデルを、モ … 続きを読む
Improving Social Media Popularity Prediction with Multiple Post Dependencies
要約 ソーシャル メディア人気予測は、レコメンデーション システムやマルチメディ … 続きを読む
Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは人間の感情と認知の重要な要素です。 その自動理解により、より自然 … 続きを読む
CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition
要約 オーディオビジュアル人物認識 (AVPR) は大きな注目を集めています。 … 続きを読む
CLIP Brings Better Features to Visual Aesthetics Learners
要約 さまざまな下流タスクに対する事前トレーニング アプローチの成功により、コン … 続きを読む