-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Comprint: Image Forgery Detection and Localization using Compression Fingerprints
要約 画像をリアルに編集する操作ツールが広く出回っているため、誰でも簡単に誤報を … 続きを読む
Hiding Images in Deep Probabilistic Models
要約 近年、ディープニューラルネットワーク(DNN)を用いたデータハイディングが … 続きを読む
Promising or Elusive? Unsupervised Object Segmentation from Real-world Single Images
要約 本論文では、単一画像からの教師無しオブジェクトセグメンテーションの問題を研 … 続きを読む
Geometry Driven Progressive Warping for One-Shot Face Animation
要約 フェイスアニメーションは、ポーズや表情がアニメーションするフォトリアリステ … 続きを読む
Learning Semantic Ambiguities for Zero-Shot Learning
要約 ゼロショット学習 (ZSL) は、トレーニング時に視覚的なサンプルが利用で … 続きを読む
CALIP: Zero-Shot Enhancement of CLIP with Parameter-free Attention
要約 Contrastive Language-Image Pre-traini … 続きを読む
Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results
要約 ユーモアは、人間の感情と認識の重要な要素です。 その自動理解は、より自然な … 続きを読む
Marine Video Kit: A New Marine Video Dataset for Content-based Analysis and Retrieval
要約 異常なドメイン固有のビデオ コレクションの効果的な分析は、最先端の汎用モデ … 続きを読む
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering
要約 Text-based Visual Question Answering~ … 続きを読む