-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
ALADIN: Distilling Fine-grained Alignment Scores for Efficient Image-Text Matching and Retrieval
要約 画像とテキストのマッチングは、視覚と言語の共同理解を伴うタスクの中で主導的 … 続きを読む
CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation
要約 マルチモーダル感情分析とうつ病推定は、マルチモーダルデータを使用して人間の … 続きを読む
Content-oriented learned image compression
要約 近年、ディープニューラルネットワークの開発により、エンドツーエンドで最適化 … 続きを読む
End-To-End Audiovisual Feature Fusion for Active Speaker Detection
要約 アクティブスピーカー検出は、人間と機械の相互作用において重要な役割を果たし … 続きを読む
VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training
要約 ファッションの服装を美的に心地よいものと見なすためには、それらを構成する衣 … 続きを読む
AutoTransition: Learning to Recommend Video Transition Effects
要約 ビデオトランジションエフェクトは、ビデオ編集で広く使用されており、ショット … 続きを読む
Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis
要約 コンテンツ編集用のツールが成熟し、メディアを合成するための人工知能(AI) … 続きを読む
Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis
要約 コンテンツ編集用のツールが成熟し、メディアを合成するための人工知能(AI) … 続きを読む
Learned Video Compression via Heterogeneous Deformable Compensation Network
要約 学習したビデオ圧縮は、動き補償が最も困難な問題の1つと見なされている、高度 … 続きを読む